内存对齐问题是各种开发类面试中最热门的问题,面试管一般认为这个问题可以考察被面试者对内存细节的了解情况,确实这个问题对于c 初学者来说是个十足的难题因为它不仅涉及了pragma pack(n) 设定的内存对齐系数还涉及了相关内存分配的细节。
内存对齐:
我们知道现代计算机体系中cpu按照双字、字、字节访问存储内存,并通过总线进行传输,若未经一定规则的对齐,cpu的访址操作与总线的传输操作将会异常的复杂,所以现代编译器中都会对内存进行自动的对齐。
1.内存对齐系数
说道内存对齐,就不得不说内存对齐系数, 对齐系数最简单的设置方法是使用 #pragma pack(n)进行设置,这部分点进链接在我的文章内有详细说明!
2.sizeof
说到内存对齐第二个不得不说的就是sizeof,它的基本作用是判断数据类型或者表达式长度,要注意的是这不是一个函数,而是一个c 中的关键字!字节数的计算在程序编译时进行,而不是在程序执行的过程中才计算出来!
3.类型的长度与数据成员对齐
你的计算机中,数据类型的长度指的就是在你的计算机中对数据类型使用sizeof得到的结果,当然这个在各种不同的编译环境下得到的结果是不同的。
比如在32位visual studio环境下:
cout << sizeof(char) << endl; // 1
cout << sizeof(short) << endl; // 2
cout << sizeof(int) << endl; // 4
cout << sizeof(long) << endl; // 4
cout << sizeof(double) << endl; // 8
而在64位g 编译环境下:
cout << sizeof(char) << endl; // 1
cout << sizeof(short) << endl; // 2
cout << sizeof(int) << endl; // 4
cout << sizeof(long) << endl; // 8
cout << sizeof(double) << endl; // 8
下面我将在32位visual studio环境下讲解数据成员对齐:
首先我们要清楚结构体struct中的成员在内存中的分配是连续的,struct内的首地址也就是struct内第一个数据成员的地址,换句话说struct内第一个数据成员离struct开始的距离offset = 0。
数据成员对齐的规则就是,而在第一个成员之后,每个成员距离struct首地址的距离 offset, 都是struct内成员自身长度(sizeof) 与 #pragma pack(n)中的n的最小值的整数倍,如果未经对齐时不满足这个规则,在对齐时就会在这个成员前填充空子节以使其达到数据成员对齐。
默认n为8时:
#pragma pack(8)
struct {
char a;
double b;
} mystruct;
cout << sizeof mystruct << endl; // 16
cout << (int *)&mystruct.a << endl; // 0024f898
cout << &mystruct.b << endl; // 0024f8a0(因运行时而异)
当设置n为4也就是min(sizeof(double), n) = 4 时:
#pragma pack(4)
struct {
char a;
double b;
} mystruct;
cout << sizeof mystruct << endl; // 12
cout << (int *)&mystruct.a << endl; // 0046f76c
cout << &mystruct.b << endl; // 0046f770
第一个例子时,最小值为8,填充7个字节到char a 之后。
第二个例子时,最小值为4,填充3个字节到char a之后。
4.整体对齐
编译器在进行过数据成员对齐之后,还要进行整体对齐。与数据对齐相似但不是完全相同, 如果数据对齐完成时struct的大小不是 struct内成员自身长度最大值(sizeof) 与 #pragma pack(n)中的n的最小值的整数倍。(注意这里是成员中长度最大的那个与n比较,而不是特定的一个成员。)就要在struct的最后添加空字节直到对齐。
当设置n为4也就是min(sizeof(short), n) = 2 时:
#pragma pack(4)
struct {
char a;
short b;
char c;
} mystruct;
cout << sizeof mystruct << endl; // 6
cout << (int *)&mystruct.a << endl; // 003dfed0
cout << &mystruct.b << endl; // 003dfed2
cout << (int *)&mystruct.c << endl; // 003dfed4
在上面的例子中,char a offset为0 因成员对齐占据[d0]填充[d1]共两个字节,short b是最大长度成员无需对齐占据[d2-d3]两个字节,它的offset是2,而char c的offset是4占据[d4]无需成员对齐,但此时struct的大小是2 2 1 = 5字节,不是2的整数倍,所以我们要填充空子节在最后直到struct大小达到2的整数倍,这就是整体对齐。
经过了数据成员对齐与整体对齐之后内存对齐就完成了,如果深入思考上述规则还会发现:即使是同样数目与数量的数据成员,在摆放的顺序不同时struct的大小也会不同,下面就是一个例子:
这样摆放是12字节:
摆放方式改变时结果确变成了8字节:
由于这种特性,如果在网络编程或相关内存操作时如果不加以注意的话,就会造成隐秘而难以纠正的错误,请大家务必小心!