本文通过Memory Analyzer工具分析查看GC Roots,对Java语言中,垃圾回收中的可达性分析算法以根对象集合(GCRoots)为起始点的GC Roots包含的元素有个全面的了解。
1、可达性分析算法
2、GC Roots
3、MAT工具对GC Roots溯源
3.1、获取程序进程ID
3.2、获取dump文件
3.3、使用MAT分析dump文件
1、可达性分析算法
可达性分析算法也叫根搜索算法、追踪性垃圾收集。相对于引用计数算法而言,可达性分析算法不仅同样具备实现简单和执行高效等特点,更重要的是该算法可以有效地解决在引用计数算法中循环引用的问题,防止内存泄漏的发生。相较于引用计数算法,这里的可达性分析就是Java、C#选择的。所谓"GCRoots”根集合就是一组必须活跃的引用。步骤如下:
1、可达性分析算法是以根对象集合(GCRoots)为起始点,按照从上至下的方式搜索被根对象集合所连接的目标对象是否可达。
2、使用可达性分析算法后,内存中的存活对象都会被根对象集合直接或间接连接着,搜索所走过的路径称为引用链
3、如果目标对象没有任何引用链相连,则是不可达的,就意味着该对象己死亡,可以标记为垃圾对象。
4、在可达性分析算法中,只有能够被根对象集合直接或者间接连接的对象才是存活对象。
2、GC Roots
由于Root采用栈方式存放变量和指针,所以如果一个指针,它保存了堆内存里面的对象,但是自己又不存放在堆内存里面,那它就是一个Root。如果要使用可达性分析算法来判断内存是否可回收,那么分析工作必须在一个能保障一致性的快照中进行。这点不满足的话分析结果的准确性就无法保证。这点也是导致GC进行时必须“stop The World”的一个重要原因。 即使是号称(几乎)不会发生停顿的CMS收集器中,枚举根节点时也是必须要停顿的。
如果只针对Java堆中的某一块区域进行垃圾回收(比如:典型的只针对新生代),必须考虑到内存区域是虚拟机自己的实现细节,更不是孤立封闭的,这个区域的对象完全有可能被其他区域的对象所引用,这时候就需要一并将关联的区域对象也加入GCRoots集合中去考虑,才能保证可达性分析的准确性。
3、MAT工具对GC Roots溯源
MAT是Memory Analyzer的简称,它是一款功能强大的Java堆内存分析器。用于查找内存泄漏以及查看内存消耗情况。MAT是基于Eclipse开发的,是一款免费的性能分析工具。下载MAT地址http://www.eclipse.org/mat/
3.1、获取程序进程ID
命令:jps -lv
3.2、获取dump文件
jmap -dump:format=b,live,file=C:\Users\sun\Desktop\dump2.hprof 76448
3.3、使用MAT分析dump文件
从上面可以查看到内存中的的gc roots,下面看一下具体main线程中的gc roots
4:GC Roots总结
GC Roots集合包含如下:
1、虚拟机栈中引用的对象 ,比如:各个线程被调用的方法中使用到的参数、局部变量等。
2、本地方法栈内JNI(通常说的本地方法)引用的对象
3、方法区中类静态属性引用的对象 ,比如:Java类的引用类型静态变量
4、方法区中常量引用的对象 ,比如:字符串常量池(String Table)里的引用
5、所有被同步锁synchronized持有的对象
6、Java虚拟机内部的引用。 基本数据类型对应的Class对象,一些常驻的异常对象(如:NullPointerException、OutOfMemoryError),系统类加载器。反映java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。
7、除了这些固定的GC Roots集合以外,根据用户所选用的垃圾收集器以及当前回收的内存区域不同,还可以有其他对象“临时性”地加入,共同构成完整GC Roots集合。比如:分代收集和局部回收(PartialGC)