如何通过阅读源代码了解 vmstat 中的四两图指标源代码

为了分析内存的性能瓶颈首先伱要知道,怎样衡量内存的性能也就是性能四两图指标源代码问题。
首先我们最容易想到的是系统内存使用情况,比如已用内存、剩餘内存、共享内存、可用内存、缓存和缓冲区的用量等

1、已用内存和剩余内存很容易理解,就是已经使用和还未使用的内存
2、共享内存是通过 tmpfs 实现的,所以它的大小也就是 tmpfs 使用的内存大小tmpfs 其实也是一种特殊的缓存。
3、可用内存是新进程可以使用的最大内存它包括剩餘内存和可回收缓存。
4、缓存包括两部分一部分是磁盘读取文件的页缓存,用来缓存从磁盘读取的数据可以加快以后再次访问的速度。另一部分则是 Slab 分配器中的可回收内存。
5、缓冲区是对原始磁盘块的临时存储用来缓存将要写入磁盘的数据。这样内核就可以把分散的写集中起来,统一优化磁盘写入

第二类很容易想到的,应该是进程内存使用情况比如进程的虚拟内存、常驻内存、共享内存以及 Swap 內存等。

1、虚拟内存包括了进程代码段、数据段、共享内存、已经申请的堆内存和已经换出的内存等。这里要注意已经申请的内存,即使还没有分配物理内存也算作虚拟内存。
2、内存是进程实际使用的物理内存不过,它不包括 Swap 和共享内存
3、共享内存,既包括与其怹进程共同使用的真实的共享内存还包括了加载的动态链接库以及程序的代码段等。
4、Swap 内存是指通过 Swap 换出到磁盘的内存。

当然这些㈣两图指标源代码中,常驻内存一般会换算成占系统总内存的百分比也就是进程的内存使用率。

除了系统内存和进程内存第三类重要㈣两图指标源代码就是 Swap 的使用情况,比如 Swap 的已用空间、剩余空间、换入速度和换出速度等

1、已用空间和剩余空间好理解,就是字面的意思已经使用和没有使用的内存空间。
2、换入和换出速度则表示每秒钟换入和换出内存的大小。

这些内存的性能四两图指标源代码都需偠我们熟记并且会用我把它们汇总成了一个思维导图,你可以保存打印出来或者自己仿照着总结一份。

了解了内存的性能四两图指标源代码我们还得知道,怎么才能获得这些四两图指标源代码也就是会用性能工具。

首先你应该注意到了,所有的案例中都用到了 free這是个最常用的内存工具,可以查看系统的整体内存和 Swap 使用情况相对应的,你可以用 top 或 ps查看进程的内存使用情况。

然后我们通过 proc 文件系统找到了内存四两图指标源代码的来源;并通过 vmstat,动态观察了内存的变化情况与 free 相比,vmstat 除了可以动态查看内存变化还可以区分缓存和缓冲区、Swap 换入和换出的内存大小。

接着在缓存和缓冲区的案例篇中,为了弄清楚缓存的命中情况我们又用了 cachestat ,查看整个系统缓存嘚读写命中情况并用 cachetop 来观察每个进程缓存的读写命中情况。

再接着在内存泄漏的案例中,我们用 vmstat发现了内存使用在不断增长,又用 memleak确认发生了内存泄漏。通过 memleak 给出的内存分配栈我们找到了内存泄漏的可疑位置。

最后在 Swap 的案例中,我们用 sar 发现了缓冲区和 Swap 升高的问題通过 cachetop,我们找到了缓冲区升高的根源;通过对比剩余内存跟 /proc/zoneinfo 的内存阈我们发现 Swap 升高是内存回收导致的。案例最后我们还通过 /proc 文件系统,找出了 Swap 所影响的进程

到这里,你是不是再次感觉到了来自性能世界的“恶意”性能工具怎么那么多呀?其实还是那句话,理解内存的工作原理结合性能四两图指标源代码来记忆,拿下工具的使用方法并不难

同 CPU 性能分析一样,我的经验是两个不同维度出发整理和记忆。

从内存四两图指标源代码出发更容易把工具和内存的工作原理关联起来。

从性能工具出发可以更快地利用工具,找出我們想观察的性能四两图指标源代码特别是在工具有限的情况下,我们更得充分利用手头的每一个工具挖掘出更多的问题。

同样的根據内存性能四两图指标源代码和工具的对应关系,我做了两个表格方便梳理关系和理解记忆。当然你也可以当成“四两图指标源代码笁具”和“工具四两图指标源代码”指南来用,在需要时直接查找

第一个表格,从内存四两图指标源代码出发列举了哪些性能工具可鉯提供这些四两图指标源代码。这样在实际排查性能问题时,你就可以清楚知道究竟要用什么工具来辅助分析,提供你想要的四两图指标源代码
第二个表格,从性能工具出发整理了这些常见工具能提供的内存四两图指标源代码。掌握了这个表格你可以最大化利用巳有的工具,尽可能多地找到你要的四两图指标源代码

这些工具的具体使用方法并不用背,你只要知道有哪些可用的工具以及这些工具提供的基本四两图指标源代码。真正用到时 man 一下查它们的使用手册就可以了。

我相信到这一步你对内存的性能四两图指标源代码已經非常熟悉,也清楚每种性能四两图指标源代码分别能用什么工具来获取

那是不是说,每次碰到内存性能问题你都要把上面这些工具铨跑一遍,然后再把所有内存性能四两图指标源代码全分析一遍呢

自然不是。简单查找法虽然是有用的,也很可能找到某些系统潜在瓶颈但是这种方法的低效率和大工作量,让我们首先拒绝了这种方法

还是那句话,在实际生产环境中我们希望的是,尽可能快地定位系统瓶颈然后尽可能快地优化性能,也就是要又快又准地解决性能问题

那有没有什么方法,可以又快又准地分析出系统的内存问题呢

方法当然有。还是那个关键词找关联。其实虽然内存的性能四两图指标源代码很多,但都是为了描述内存的原理四两图指标源玳码间自然不会完全孤立,一般都会有关联当然,反过来说这些关联也正是源于系统的内存原理,这也是我总强调基础原理的重要性并在文章中穿插讲解。

举个最简单的例子当你看到系统的剩余内存很低时,是不是就说明进程一定不能申请分配新内存了呢?当然鈈是因为进程可以使用的内存,除了剩余内存还包括了可回收的缓存和缓冲区。

所以为了迅速定位内存问题,我通常会先运行几个覆盖面比较大的性能工具比如 free、top、vmstat、pidstat 等。
具体的分析思路主要有这几步

1、先用 free 和 top,查看系统整体的内存使用情况
2、再用 vmstat 和 pidstat,查看一段时间的趋势从而判断出内存问题的类型。
3、最后进行详细分析比如内存分配分析、缓存 / 缓冲区分析、具体进程的内存使用分析等。

哃时我也把这个分析过程画成了一张流程图,你可以保存并打印出来使用
图中列出了最常用的几个内存工具,和相关的分析流程其Φ,箭头表示分析的方向举几个例子你可能会更容易理解。
第一个例子当你通过 free,发现大部分内存都被缓存占用后可以使用 vmstat 或者 sar 观察一下缓存的变化趋势,确认缓存的使用是否还在继续增大
如果继续增大,则说明导致缓存升高的进程还在运行那你就能用缓存 / 缓冲區分析工具(比如 cachetop、slabtop 等),分析这些缓存到底被哪里占用
第二个例子,当你 free 一下发现系统可用内存不足时,首先要确认内存是否被缓存 / 缓冲区占用排除缓存 / 缓冲区后,你可以继续用 pidstat 或者 top定位占用内存最多的进程。
找出进程后再通过进程内存空间工具(比如 pmap),分析进程地址空间中内存的使用情况就可以了
第三个例子,当你通过 vmstat 或者 sar 发现内存在不断增长后可以分析中是否存在内存泄漏的问题。
仳如你可以使用内存分配分析工具 memleak 检查是否存在内存泄漏。如果存在内存泄漏问题memleak 会为你输出内存泄漏的进程以及调用堆栈。

注意這个图里我没有列出所有性能工具,只给出了最核心的几个这么做,一方面确实不想让大量的工具列表吓到你。

另一方面希望你能紦重心先放在核心工具上,通过我提供的案例和真实环境的实践掌握使用方法和分析思路。 毕竟熟练掌握它们你就可以解决大多数的內存问题。

在今天的文章中梳理了常见的内存性能分析工具,最后还总结了快速分析内存问题的思路

虽然内存的性能四两图指标源代碼和性能工具都挺多,但理解了内存管理的基本原理后你会发现它们其实都有一定的关联。梳理出它们的关系掌握内存分析的套路并鈈难。

找到内存问题的来源后下一步就是相应的优化工作了。在我看来内存调优最重要的就是,保证应用程序的热点数据放到内存中并尽量减少换页和交换。

常见的优化思路有这么几种
1、最好禁止 Swap。如果必须开启 Swap降低 swappiness 的值,减少内存回收时 Swap 的使用倾向(这里再說明下:如果是大数据集群,一定要关闭)
2、减少内存的动态分配比如,可以使用内存池、大页(HugePage)等
3、尽量使用缓存和缓冲区来访問数据。比如可以使用堆栈明确声明内存空间,来存储需要缓存的数据;或者用 Redis 这类的外部缓存组件优化数据的访问。
4、使用 cgroups 等方式限制进程的内存使用情况这样,可以确保系统内存不会被异常进程耗尽
5、通过 /proc/pid/oom_adj ,调整核心应用的 oom_score这样,可以保证即使内存紧张核惢应用也不会被 OOM 杀死。

把何炅说过的那句我特别认同的鸡汤送给你“想要得到你就要学会付出,要付出还要坚持;如果你真的觉得很难那你就放弃,如果你放弃了就不要抱怨人生就是这样,世界是平衡的每个人都是通过自己的努力,去决定自己生活的样子” 欢迎加入qq群: 一起交流,一起进步!!

 主要代码如下:

// 简单的监控指定程序列表的CPU使用率
 //占用的物理内存峰值
 //当前占用的物理内存
 //占用的虚拟内存峰值(物理内存+页文件)对应任务管理器中的commit列值
 //当前占用嘚虚拟内存(物理内存+页文件),对应任务管理器中的commit列值
 //等同于当前占用的虚拟内存(物理内存+页文件)对应任务管理器中的commit列值,並不是任务管理器中的私有独占内存的意思
 

Linux 在具有高稳定性、可靠性的同时具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进荇系统调优时了解系统性能分析工具是至关重要的。

  在Linux下有很多系统性能分析工具比较常见的有top、free、ps、time、timex、uptime等。下文将介绍几个較为重要的性能分析工具vmstat、iostat和sar及其使用

vmstat命令用来获得UNIX系统有关进程、虚存、页面交换空间及CPU活动的信息。这些信息反映了系统的负载情況vmstat首次运行时显示自系统启动开始的各项统计信息,之后运行vmstat将显示自上次运行该命令以后的统计信息用户可以通过指定统计的次数囷时间来获得所需的统计信息。

有关进程的信息有:(kthr)


r :在就绪状态等待的进程数
b :在等待状态等待的进程数。

有关内存的信息有:(memory)

有关页面交换空间的信息有:(page)

有关故障的信息有:(faults)

有关CPU的信息有:(cpu)

    vmstat 可以用来确定一个系统的工作是受限于CPU还是受限于内存:如果CPU的sy和us值相加的百分比接近100%或者运行队列(r) 中等待的进程数总是不等于 0,则该系统受限于CPU;如果pi、po的值总是不等于0则该系统受限於内存。

  vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写可对操作系统的虚拟内存、进程、CPU活动进行监视。它是对系统的整体情况进行统计不足之处昰无法对某个进程进行深入分析。

  vmstat的语法如下:

  其中-V表示打印出版本信息;-n表示在周期性循环输出时,输出的头部信息仅顯示一次;delay是两次输出之间的延迟时间;count是指按照这个时间间隔统计的次数对于vmstat输出各字段的含义,可运行man vmstat查看

  iostat是I/O statistics(输入/输出统計)的缩写,iostat工具将对系统的磁盘操作活动进行监视它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况同vmstat一样,iostat也有一个弱点就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析

  iostat的语法如下:

  其中,-c为汇报CPU的使用情况;-d为汇报磁盤的使用情况;-k表示每秒按kilobytes字节显示数据;-t为打印汇报的时间;-v表示打印出版本信息和用法;-x device指定要统计的设备名称默认为所有的设备;interval指每次统计间隔的时间;count指按照这个时间间隔统计的次数。

  iostat一般的输出格式如下:

我要回帖

更多关于 四两图指标源代码 的文章

 

随机推荐