聊聊ThreadLocal

9、聊聊ThreadLocal

9.1 是什么

  • 稍微翻译一下:ThreadLocal提供线程局部变量。这些变量与正常的变量不同,因为每一个线程在访问ThreadLocal实例的时候(通过其get或set方法)都有自己的、独立初始化的变量副本。ThreadLocal实例通常是类中的私有静态字段,使用它的目的是希望将状态(例如,用户ID或事务ID)与线程关联起来。

9.2 能干嘛

  • 实现每一个线程都有自己专属的本地变量副本(自己用自己的变量不麻烦别人,不和其他人共享,人人有份,人各一份)。

  • 主要解决了让每个线程绑定自己的值,通过使用get()和set()方法,获取默认值或将其值更改为当前线程所存的副本的值从而避免了线程安全问题,比如我们之前讲解的8锁案例,资源类是使用同一部手机,多个线程抢夺同一部手机使用,假如人手一份是不是天下太平??

9.3 api介绍

9.4 原需求Code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
class House //资源类
{
int saleCount = 0;

public synchronized void saleHouse() {
++saleCount;
}
}

/**
* <p>
* 需求1: 5个销售卖房子,集团高层只关心销售总量的准确统计数。
* <p>
* 需求2: 5个销售卖完随机数房子,各自独立销售额度,自己业绩按提成走,分灶吃饭,各个销售自己动手,丰衣足食
*/
public class ThreadLocalDemo {
public static void main(String[] args) throws InterruptedException {

House house = new House();

for (int i = 1; i <= 5; i++) {
new Thread(() -> {
int size = new Random().nextInt(5) + 1;
System.out.println(size);
for (int j = 1; j <= size; j++) {
house.saleHouse();
}
}, String.valueOf(i)).start();
}
;

//暂停毫秒
try {
TimeUnit.MILLISECONDS.sleep(300);
} catch (InterruptedException e) {
e.printStackTrace();
}

System.out.println(Thread.currentThread().getName() + "\t" + "共计卖出多少套: " + house.saleCount);
}
}

9.5 新需求Code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
class House //资源类
{
int saleCount = 0;

public synchronized void saleHouse() {
++saleCount;
}

/*ThreadLocal<Integer> saleVolume = new ThreadLocal<Integer>(){
@Override
protected Integer initialValue()
{
return 0;
}
};*/
ThreadLocal<Integer> saleVolume = ThreadLocal.withInitial(() -> 0);

public void saleVolumeByThreadLocal() {
saleVolume.set(1 + saleVolume.get());
}
}

/**
* <p>
* 需求1: 5个销售卖房子,集团高层只关心销售总量的准确统计数。
* <p>
* 需求2: 5个销售卖完随机数房子,各自独立销售额度,自己业绩按提成走,分灶吃饭,各个销售自己动手,丰衣足食
*/
public class ThreadLocalDemo {
public static void main(String[] args) throws InterruptedException {

House house = new House();

for (int i = 1; i <= 5; i++) {
new Thread(() -> {
int size = new Random().nextInt(5) + 1;
try {
for (int j = 1; j <= size; j++) {
house.saleHouse();
house.saleVolumeByThreadLocal();
}
System.out.println(Thread.currentThread().getName() + "\t" + "号销售卖出:" + house.saleVolume.get());
} finally {
house.saleVolume.remove();
}
}, String.valueOf(i)).start();
}
;

//暂停毫秒
try {
TimeUnit.MILLISECONDS.sleep(300);
} catch (InterruptedException e) {
e.printStackTrace();
}

System.out.println(Thread.currentThread().getName() + "\t" + "共计卖出多少套: " + house.saleCount);
}
}

9.6 阿里手册对使用ThreadLocal的规范

9.7 Code2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
class MyData {
ThreadLocal<Integer> threadLocalField = ThreadLocal.withInitial(() -> 0);

public void add() {
threadLocalField.set(1 + threadLocalField.get());
}
}

/**
* @auther zzyy
* .【强制】必须回收自定义的 ThreadLocal 变量,尤其在线程池场景下,线程经常会被复用,如果不清理
* 自定义的 ThreadLocal 变量,可能会影响后续业务逻辑和造成内存泄露等问题。尽量在代理中使用
* try-finally 块进行回收。
*/
public class ThreadLocalDemo2 {
public static void main(String[] args) throws InterruptedException {
MyData myData = new MyData();

ExecutorService threadPool = Executors.newFixedThreadPool(3);

try {
for (int i = 0; i < 10; i++) {
threadPool.submit(() -> {
try {
Integer beforeInt = myData.threadLocalField.get();
myData.add();
Integer afterInt = myData.threadLocalField.get();
System.out.println(Thread.currentThread().getName() + "\t" + "beforeInt:" + beforeInt + "\t afterInt: " + afterInt);
} finally {
myData.threadLocalField.remove();
}
});
}
} catch (Exception e) {
e.printStackTrace();
} finally {
threadPool.shutdown();
}
}
}

9.8 Thread,ThreadLocal,ThreadLocalMap关系

9.8.1 Thread和ThreadLocal

9.8.2 ThreadLocal和ThreadLocalMap

9.8.3 All三者总概括

9.8.4 小总结

  • 近似的可以理解为:ThreadLocalMap从字面上就可以看出这是一个保存ThreadLocal对象的map(其实是以ThreadLocal为Key),不过是经过了两层包装的ThreadLocal对象:

  • JVM内部维护了一个线程版的Map<ThreadLocal,Value>(通过ThreadLocal对象的set方法,结果把ThreadLocal对象自己当做key,放进了ThreadLocalMap中),每个线程要用到这个T的时候,用当前的线程去Map里面获取,通过这样让每个线程都拥有了自己独立的变量,人手一份,竞争条件被彻底消除,在并发模式下是绝对安全的变量。

9.9 ThreadLocal内存泄露问题

9.9.1 从阿里面试题开始讲起

  • 为什么要用弱引用?不用如何?

9.9.2 why

9.9.3 再回首ThreadLocalMap

9.9.4 强引用、软引用、弱引用、虚引用分别是什么?

9.9.4.1 整体架构

  • Java技术允许使用finalize()方法在垃圾收集器将对象从内存中清除出去之前做必要的清理工作。

9.9.4.2 新建一个带finalize()方法的对象MyObject

1
2
3
4
5
6
7
8
class MyObject {
//这个方法一般不用复写,我们只是为了教学给大家演示案例做说明
@Override
protected void finalize() throws Throwable {
// finalize的通常目的是在对象被不可撤销地丢弃之前执行清理操作。
System.out.println("-------invoke finalize method~!!!");
}
}

9.9.4.3 强引用(默认支持模式)与case

  • 当内存不足,JVM开始垃圾回收,对于强引用的对象,就算是出现了OOM也不会对该对象进行回收,死都不收。

  • 强引用是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾收集器不会碰这种对象。在Java中最常见的就是强引用,把一个对象赋给一个引用变量,这个引用变量就是一个强引用。

  • 当一个对象被强引用变量引用时,它处于可达状态,它是不可能被垃圾回收机制回收的,即使该对象以后永远都不会被用到,JVM也不会回收。因此强引用是造成Java内存泄漏的主要原因之一。

  • 对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者显式地将相应(强)引用赋值为null,一般认为就是可以被垃圾收集的了(当然具体回收时机还是要看垃圾收集策略)。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    class MyObject {
    //这个方法一般不用复写,我们只是为了教学给大家演示案例做说明
    @Override
    protected void finalize() throws Throwable {
    // finalize的通常目的是在对象被不可撤销地丢弃之前执行清理操作。
    System.out.println("-------invoke finalize method~!!!");
    }
    }

    public class Main {
    public static void main(String[] args) {
    MyObject myObject = new MyObject();
    System.out.println("gc before: " + myObject);

    myObject = null;
    System.gc();//人工开启GC,一般不用

    //暂停毫秒
    try {
    TimeUnit.MILLISECONDS.sleep(500);
    } catch (InterruptedException e) {
    e.printStackTrace();
    }

    System.out.println("gc after: " + myObject);
    }
    }

9.9.4.4 软引用与case

  • 软引用是一种相对强引用弱化了一些的引用,需要用java.lang.ref.SoftReference类来实现,可以让对象豁免一些垃圾收集。

  • 对于只有软引用的对象来说,

    • 当系统内存充足时它不会被回收,
    • 当系统内存不足时它会被回收。
  • 软引用通常用在对内存敏感的程序中,比如高速缓存就有用到软引用,内存够用的时候就保留,不够用就回收!

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    // 添加虚拟机参数-Xms10m -Xmx10m
    public class Main {
    public static void main(String[] args) {
    SoftReference<MyObject> softReference = new SoftReference<>(new MyObject());
    System.out.println("-----softReference:"+softReference.get());

    System.gc();
    try {
    TimeUnit.SECONDS.sleep(1);
    } catch (InterruptedException e) {
    e.printStackTrace();
    }
    System.out.println("-----gc after内存够用: " + softReference.get());

    try {
    byte[] bytes = new byte[20 * 1024 * 1024];//20MB对象
    } catch (Exception e) {
    e.printStackTrace();
    } finally {
    System.out.println("-----gc after内存不够: " + softReference.get());
    }
    }
    }

9.9.4.5 弱引用与case

  • 弱引用需要用java.lang.ref.WeakReference类来实现,它比软引用的生存期更短,

  • 对于只有弱引用的对象来说,只要垃圾回收机制一运行,不管JVM的内存空间是否足够,都会回收该对象占用的内存。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    public class Main {
    public static void main(String[] args) {
    WeakReference<MyObject> weakReference = new WeakReference<>(new MyObject());
    System.out.println("-----gc before 内存够用: " + weakReference.get());

    System.gc();
    //暂停几秒钟线程
    try {
    TimeUnit.SECONDS.sleep(1);
    } catch (InterruptedException e) {
    e.printStackTrace();
    }

    System.out.println("-----gc after 内存够用: " + weakReference.get());
    }
    }

9.9.4.6 软引用和弱引用的适用场景

  • 假如有一个应用需要读取大量的本地图片:

    • 如果每次读取图片都从硬盘读取则会严重影响性能,
    • 如果一次性全部加载到内存中又可能造成内存溢出。
  • 此时使用软引用可以解决这个问题。

    • 设计思路是:用一个HashMap来保存图片的路径和相应图片对象关联的软引用之间的映射关系,在内存不足时,JVM会自动回收这些缓存图片对象所占用的空间,从而有效地避免了OOM的问题。
      Map<String,SoftReference<Bitmap>>imageCache=new HashMap<String,SoftReference<Bitmap>>();

9.9.4.7 虚引用与case

  • 虚引用必须和引用队列(ReferenceQueue)联合使用。

    • 虚引用需要java.lang.ref.PhantomReference类来实现,顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收器回收,它不能单独使用也不能通过它访问对象,虚引用必须和引用队列(ReferenceQueue)联合使用。
  • PhantomReference的get方法总是返回null。

    • 虚引用的主要作用是跟踪对象被垃圾回收的状态。仅仅是提供了一种确保对象被finalize以后,做某些事情的通知机制。PhantomReference的get方法总是返回null,因此无法访问对应的引用对象。
  • 处理监控通知。

    • 使用换句话说,设置虚引用关联对象的唯一目的,就是在这个对象被收集器回收的时候收到一个系统通知或者后续添加进一步的处理,用来实现比finalize机制更灵活的回收操作。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    // 添加虚拟机参数-Xms10m -Xmx10m
    public class Main {
    public static void main(String[] args) {
    MyObject myObject = new MyObject();
    ReferenceQueue<MyObject> referenceQueue = new ReferenceQueue<>();
    PhantomReference<MyObject> phantomReference = new PhantomReference<>(myObject, referenceQueue);
    System.out.println(phantomReference.get());

    List<byte[]> list = new ArrayList<>();

    new Thread(() -> {
    while (true) {
    list.add(new byte[1 * 1024 * 1024]);
    try {
    TimeUnit.MILLISECONDS.sleep(500);
    } catch (InterruptedException e) {
    e.printStackTrace();
    }
    System.out.println(phantomReference.get() + "\t" + "list add ok");
    }
    }, "t1").start();

    new Thread(() -> {
    while (true) {
    Reference<? extends MyObject> reference = referenceQueue.poll();
    if (reference != null) {
    System.out.println("-----有虚对象回收加入了队列");
    break;
    }
    }
    }, "t2").start();
    }
    }
9.9.4.7.1 构造方法
9.9.4.7.2 引用队列

9.9.4.8 GCRoots和四大引用小总结

9.9.5 关系

  • ThreadLocal是一个壳子,真正的存储结构是ThreadLocal里有ThreadLocalMap这么个内部类,每个Thread对象维护着一个ThreadLocalMap的引用,ThreadLocallMap是ThreadLocal的内部类,用Entry来进行存储。

  • 调用ThreadLocal的set()方法时,实际上就是往ThreadLocalMap设置值,key是ThreadLocal对象,值Value是传递进来的对象。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    public void set(T value) {
    //(1)获取当前线程(调用者线程)
    Thread t = Thread.currentThread();
    //(2)以当前线程作为key值,去查找对应的线程变量,找到对应的map
    ThreadLocalMap map = getMap(t);
    //(3)如果map不为null,就直接添加本地变量,key为当前定义的ThreadLocal变量的this引用,值为添加的本地变量值
    if (map != null)
    map.set(this, value);
    //(4)如果map为null,说明首次添加,需要首先创建出对应的map
    else
    createMap(t, value);
    }
  • 调用ThreadLocal的get()方法时,实际上就是往ThreadLocalMap获取值,key是ThreadLocal对象。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    public void set(T value) {
    //(1)获取当前线程(调用者线程)
    Thread t = Thread.currentThread();
    //(2)以当前线程作为key值,去查找对应的线程变量,找到对应的map
    ThreadLocalMap map = getMap(t);
    //(3)如果map不为null,就直接添加本地变量,key为当前定义的ThreadLocal变量的this引用,值为添加的本地变量值
    if (map != null)
    map.set(this, value);
    //(4)如果map为null,说明首次添加,需要首先创建出对应的map
    else
    createMap(t, value);
    }
    2)调用ThreadLocal的get()方法时,实际上就是往ThreadLocalMap获取值,key是ThreadLocal对象。
    public T get() {
    //(1)获取当前线程
    Thread t = Thread.currentThread();
    //(2)获取当前线程的threadLocals变量
    ThreadLocalMap map = getMap(t);
    //(3)如果threadLocals变量不为null,就可以在map中查找到本地变量的值
    if (map != null) {
    ThreadLocalMap.Entry e = map.getEntry(this);
    if (e != null) {
    @SuppressWarnings("unchecked")
    T result = (T)e.value;
    return result;
    }
    }
    //(4)执行到此处,threadLocals为null,调用该更改初始化当前线程的threadLocals变量
    return setInitialValue();
    }

    private T setInitialValue() {
    //protected T initialValue() {return null;}
    T value = initialValue();
    //获取当前线程
    Thread t = Thread.currentThread();
    //以当前线程作为key值,去查找对应的线程变量,找到对应的map
    ThreadLocalMap map = getMap(t);
    //如果map不为null,就直接添加本地变量,key为当前线程,值为添加的本地变量值
    if (map != null)
    map.set(this, value);
    //如果map为null,说明首次添加,需要首先创建出对应的map
    else
    createMap(t, value);
    return value;
    }
  • ThreadLocal本身并不存储值(ThreadLocal是一个壳子),它只是自己作为一个key来让线程从ThreadLocalMap获取value。正因为这个原理,所以ThreadLocal能够实现“数据隔离”,获取当前线程的局部变量值,不受其他线程影响。

9.9.6 为什么要用弱引用?不用如何?

9.9.6.1 为什么源代码用弱引用?

  • 当function01方法执行完毕后,栈帧销毁强引用tl也就没有了。但此时线程的ThreadLocalMap里某个entry的key引用还指向这个对象。

    • 若这个key引用是强引用,就会导致key指向的ThreadLocal对象及v指向的对象不能被gc回收,造成内存泄漏;
    • 若这个key引用是弱引用就大概率会减少内存泄漏的问题(还有一个key为null的雷,第2个坑后面讲)。使用弱引用,就可以使ThreadLocal对象在方法执行完毕后顺利被回收且Entry的key引用指向为null。

9.9.6.2 埋雷二号坑

9.9.6.3 key为null的entry,原理解析

  • ThreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal没有外部强引用引用他,那么系统gc的时候,这个ThreadLocal势必会被回收,这样一来,ThreadLocalMap中就会出现key为null的Entry,就没有办法访问这些key为null的Entry的value,如果当前线程再迟迟不结束的话(比如正好用在线程池),这些key为null的Entry的value就会一直存在一条强引用链。
  • 虽然弱引用,保证了key指向的ThreadLocal对象能被及时回收,但是v指向的value对象是需要ThreadLocalMap调用get、set时发现key为null时才会去回收整个entry、value,因此弱引用不能100%保证内存不泄露。我们要在不使用某个ThreadLocal对象后,手动调用remoev方法来删除它,尤其是在线程池中,不仅仅是内存泄露的问题,因为线程池中的线程是重复使用的,意味着这个线程的ThreadLocalMap对象也是重复使用的,如果我们不手动调用remove方法,那么后面的线程就有可能获取到上个线程遗留下来的value值,造成bug。

9.9.6.4 set()

9.9.6.5 get()

9.9.6.6 remove()

9.9.6.7 结论

  • 从前面的set,getEntry,remove方法看出,在threadLocal的生命周期里,针对threadLocal存在的内存泄漏的问题,都会通过expungeStaleEntry,cleanSomeSlots,replaceStaleEntry这三个方法清理掉key为null的脏entry。

9.9.7 结论

9.9.8 建议把ThreadLocal修饰为static