细节补充
大约 5 分钟
1. CMS和G1的漏标问题解决及三色标记算法图解
2. 三色标记算法
GC Root如果想要查找到存活对象,会根据可达性分析算法分析,遍历整个引用链 ,按照是否访问过该对象分成三种不同的颜色盒子(容器):白色、灰色、黑色盒子。
白色:本对象没有被访问过(没有被GC Root扫描过,有可能是垃圾对象)
灰色:本对象已经被访问过(被GC Root扫描过),且本对象中的属性没有被GC Root扫描,该对象就是为灰色对象;
如果该对象的属性被扫描的情况下,从灰色变为黑色
。黑色:本对象已经被访问过(被GC Root扫描过),且本对象中的属性已经被GC Root扫描过,该对象就是为黑色对象。
3. 三色标记算法原理
流程
在初始阶段的时候,所有的对象都是存放在白色容器中
初始标记阶段,GC Root标记直接关联对象置为灰色
并发标记阶段,扫描整个引用链,有子节点的话,则当前节点变为黑色,子节点变为灰色
在白色盒子剩下的对象都是为没有被GC Root关联的对象,可能会被垃圾回收机制清理
下次GC Root起点从灰色节点开始计算
三色标记算法缺陷
- 在并发标记阶段的时候,因为用户线程与GC线程同时运行,有可能会产生多标或者漏标;
- 多标--多标记(浮动垃圾)
- 漏标--漏标记
4. 浮动垃圾
- 并发标记:用户与GC线程同时运行,假设现在扫描到C对象,B对象变为黑色,用户线程执行C的属性E=null,GC线程扫描C对象引用链,认为E对象是为可达对象,但是C对象根本没有引入到E对象,E对象应该是为垃圾对象,这种问题,可以在重新标记阶段(修正)修复。
- 并发清除阶段:用户与GC线程同时运行,会产生新的对象但是没有及时被GC清理。 只能在下一次GC清理垃圾的修复。
5. 漏标问题
- 用户线程先执行C的E属性=null;GC线程的GC Root就扫描不到E。GC就认为E对象就是为垃圾对象,不可达对象;
- 用户线有执行B.E属性=E;E对象就是应该是为可达对象;
- 因为GCRoot是从C开始,不会从黑色的B开始,就会导致漏标的情况发生。
漏标的问题满足两个条件:
- 一个黑色对象指向了白色对象;
- 所有灰色对象扫描完整个链时,删除之前所有白色对象。
6. CMS如何解决漏标问题---写屏障+增量更新方式
- 增量更新破坏的是漏标第一个条件,灰色对象与白色对象断开连接,在并发标记阶段当我们黑色对象(B)引用关联白色对象(E),记录下B黑色对象。
- 在重新标记阶段(所有用户线程暂停),有将B对象变为灰色对象将整个引用链全部扫描。可以简单理解为,当一个黑色对象增加了对白色对象的引用,那么这个黑色对象就被变灰
- 缺点:遍历B整个链的效率非常低,有可能会导致用户线程等待的时间非常长。
7. G1如何解决漏标问题---原始快照方式
在C断开E的时候,会记录原始快照,在重新标记阶段的时候以白色对象变为灰色为起始点扫描整个链,本次GC是不会被清理。 可以简单理解为:当一个灰色对象取消了对白色对象的引用,那么这个白色对象被变灰
**好处:**如果假设B(黑色对象)引入该白色对象的时候,无需做任何遍历效率是非常高。
**缺点:**这个白色对象有可能并没有黑色对象去引用它,但是它还是被变灰了,就会导致它和它的引用,本来应该被垃圾回收掉,但是此次GC存活了下来,就是所谓的浮动垃圾
。如果假设B(黑色对象) 没有引入该白色对象的时候,该白色对象在本次GC继续存活,只能放在下一次GC在做并发标记的时候清理。
tips:以浮动垃圾(占内存空间)换让我们用户线程能够暂停的时间更加短。
8. 总结
- CMS收集器解决漏标问题:增量方式 如果现在B(黑色)对象引入白色对象,写屏障。 好处:避免浮动垃圾,缺点扫描整个引用链效率比较低。
- G1收集器解决漏标问题:原始快照方式。 好处:效率非常高,无需扫描整个引用链,缺点:可能会产生浮动垃圾。