在测试,特别是性能测试或者系统的稳定性测试中,内存的使用情况是一个很重要的监控点,不管是从资源使用的角度还是从发现内存泄露问题的角度。
如果笼统的来看,大概就是两个指标,系统的内存使用率和进程使用的内存。但是现实世界的事情往往没有那么简单,稍微细一点来看其实有很多的科目。本文不是一个全面的关于内存使用的探讨,甚至也不是一个详细的linux下面进程内存使用情况的分析,尽管这里的实践是基于此的。
这里想做的是稍微细节一点的来看linux下一个进程的内存使用情况,包括栈和堆。
首先我们从一个简单的c程序开始。且慢,先说一下我试验的环境。
platform: centos release 5.6 (final) linux localhost.localdomain 2.6.18-238.19.1.el5xen #1 smp fri jul 15 08:57:45 edt 2011 i686 i686 i386 gnu/linux
gcc version 4.1.2 20080704 (red hat 4.1.2-50)
[root@localhost test]# cat simple_hello.c
#include
int main()
{
int i,m = 1024, n = 0, x;
int a[m];
printf("assign %d values to a[%d]...\n", n, m);
for (i = 0; i < n; i )
{
a[i] = 100;
}
printf("value assigned.\n");
scanf("%d", &x); /* to hold program.. */
return 0;
}
真是一个很简单的程序,只比hello world复杂一点点。创建一个静态的数组,长度通过m来控制,然后选择性的给部分或者全部的元素赋值,通过n来控制。好吧,这个一个简单的程序能看出什么呢?那我们一起来看看。
在linux下面,查看一个进程的内存使用我们可以下面的命令来实现,只需把其中的[pid]换成进程实际的pid。
为了方便,我们把查找pid和看内存整合成一条命令,后面这将是我们唯一的测试工具。
cat /proc/`ps -ef|grep hello | grep -v grep | awk '{print $2}'`/status | grep -e 'vmsize|vmrss|vmdata|vmstk|vmexe|vmlib'
在这里我们关注vmsize|vmrss|vmdata|vmstk|vmexe|vmlib 这个6个指标,下面有一些简单的解释。
vmsize(kb) :虚拟内存大小。整个进程使用虚拟内存大小,是vmlib, vmexe, vmdata, 和 vmstk的总和。
vmrss(kb):虚拟内存驻留集合大小。这是驻留在物理内存的一部分。它没有交换到硬盘。它包括代码,数据和栈。
vmdata(kb): 程序数据段的大小(所占虚拟内存的大小),堆使用的虚拟内存。
vmstk(kb): 任务在用户态的栈的大小,栈使用的虚拟内存
vmexe(kb): 程序所拥有的可执行虚拟内存的大小,代码段,不包括任务使用的库
vmlib(kb) :被映像到任务的虚拟内存空间的库的大小
ok, 测试开始了。
首先,我们固定m的值为409600,相当于400k,因为数组的元素是int型,在我的环境里面是4byte,所以真个数组的大小为1600kb。
m固定化,我们不断调整n的大小,重写编译,执行,然后用上面的命令查看内存的使用情况,这样我们得到了下面这个表格。
从这里我们可以得到几个信息:
- 静态的数组使用的空间被分配到vmstk,也就是栈区。
-
在数组没有初始化的时候并没有实际占用虚拟内存,看vmrss,但是整个虚拟内存的大小还是分配了,vmsize。
接下来我们做另一个测试,让n=m,调整m的大小,也就是说调整数组的大小,然后初始化所有的元素。
这样我们得到了下面的表。
从这个表中,我们可以看出:
- 栈的使用确实和数组的size相关,但是有个起始预分配的大小,应该是编译器的优化。
-
vmrss和vmsize跟着一起在涨。
嗯,是跟着在涨,但是有个问题,栈的空间是有限的,通过这个程序或者你查看系统的设置你可以找到上限。在我的这台机器上上限是8mb,每个进程,所以这里如果m的值大于2048000,就会出segmentation fault的错误。当然你也可以调整系统的设置,比如通过
将上限调为10mb。但是这个终究不能调得很大,因为对系统会有影响。所以编程中太大的静态数组不是有个好主意。
栈的大小限制还是蛮严格的,好吧,那我们来看看程序可以使用的另一类存储空间,堆(heap)。关于堆和栈的区别可能是一个常被问道的问题,你在很多地方可以找到答案。
ok,我们继续我们的实验,考虑到现在很多系统的后台用c 来写,我们也把测试程序换成c 的。好吧,我承认其实没有太大的区别,只是申请内存的方式不太一样了。
[root@localhost test]# cat hello.cpp
#include
using namespace std;
int main()
{
cout<<"new some space for array, assign value"<>x; //hold program
}