最新要闻

广告

手机

iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?

iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?

警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案

警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案

家电

快讯:C++ 结构体对齐

来源:博客园

C++ 结构体对齐

引言

数据结构对齐是数据在计算机内存中排列和访问的方式。它由三个独立但相关的问题组成:数据对齐、数据结构填充和打包。现代计算机硬件中的 CPU 在数据自然对齐时最有效地执行内存读取和写入,这通常意味着数据的内存地址是数据大小的倍数。例如,在 32 位架构中,如果数据存储在四个连续字节中并且第一个字节位于4字节边界上,则数据可能是对齐的。

数据对齐是根据元素的自然对齐方式对齐元素。为了确保自然对齐,可能需要在结构元素之间或结构的最后一个元素之后插入一些填充。例如,在 32 位机器上,包含一个 16 位值后跟一个 32 位值的数据结构可以在 16 位值和 32 位值之间有 16 位填充以对齐 32 位值32 位边界上的值。或者,可以打包结构,省略填充,这可能会导致访问速度变慢,但会使用四分之三的内存。


【资料图】

尽管数据结构对齐是所有现代计算机的基本问题,但许多计算机语言和计算机语言实现会自动处理数据对齐。 Fortran、Ada、PL/I、Pascal、某些 C 和 C++ 实现、D、Rust、C#、和汇编语言至少允许部分控制数据结构填充,这在某些特殊情况下可能很有用。

如何计算填充

这里以64位操作系统为例,首先我们列出一些基本类型的对其大小。

类型对齐大小
char(1byte)1
short(2bytes)2
long(4bytes)4
float(4bytes)4
double(8bytes)8
long double(8bytes)8

以long类型为例,long的对齐大小为4,代表着这个类型的地址应该可以被4所整除,也就是其二进制地址应该是以0b100结尾。同理,short就是以0b10结尾,double就是以0b1000结尾。需要注意的是对齐大小都是2的整数次幂。

int main(int argc, char const *argv[]){    static_assert(alignof(long) == 4);    alignas(4) long x;    std::bitset<64> address = (uint64_t)std::addressof(x);    // 0000000000000000000000000111001010111111010111111111101100111100    std::cout << address.to_string() << "\n";    return 0;   }

知道了基础类型之后,我们来看结构体的类型:

struct F1{                  //   alignment  sizeof     int8_t i8;    //      1          1    int16_t i16;  //      2          2    double f64;   //      8          8};static_assert(alignof(F1) == 8);static_assert(sizeof(F1) == 16);

1、如何计算对齐大小?

结构体类型的对齐大小为最大的成员字段的对齐大小,F1结构体中f64字段对齐大小是最大的,所以F1的对齐大小和double保持一致。

2、如何计算结构体大小

int main(int argc, char const *argv[]){    alignas(8) F1 f;    std::bitset<64> address;        // 0b000000    address = (uint64_t)std::addressof(f);    std::cout << address.to_string() << "\n";    // 0b000000    address = (uint64_t)std::addressof(f.i8);    std::cout << address.to_string() << "\n";    // 0b000010    address = (uint64_t)std::addressof(f.i16);    std::cout << address.to_string() << "\n";        // 0b001000    address = (uint64_t)std::addressof(f.f64);    std::cout << address.to_string() << "\n";    return 0;   }

我们将f及其所有字段的地址的最后6比特打印出来。由于f是按照8字节对齐,所以f的二进制地址最后应该是0b1000结尾。i8是按照1字节对齐,它是结构体的第一个字段,其地址和f地址一样。i16是按照2字节对齐的,所以他的地址应该是以0b100结尾,而f的地址0b000000在安放完一个i8后的下一个以0b100结尾的地址是0b000010,所以i16会被安放在0b000010。f64是按照8字节对齐,而f的地址0b000000在安放完一个i8和一个i16后的下一个以0b1000结尾的地址是0b001000,所以f64会被安放在0b001000,如图所示:

图1

模拟布局

为了更好地了解结构体的内存布局,接下来我们来模拟一下。

template  struct layout_impl;template  struct layout_impl, std::index_sequence>{     // ...};// Ts... 是我们结构体每一个字段的类型template struct layout : layout_impl<    std::tuple, std::make_index_sequence>{};

首先是构造函数,我们使用一个数组来记录每个字段的数量,在构造时提供每个字段的数量即可。

template  struct layout_impl, std::index_sequence>{    // C++目前不允许layout_impl(size_t... sizes)这种写法,我们利用模板来完成这个功能    constexpr explicit layout_impl(detail::to_size_t... sizes)      : m_sizes{ sizes... } {}    std::array m_sizes;};/*struct F1{    int8_t i8;        int16_t i16;      double f64;   }; => layout(1, 1, 1)struct TreeNode{    int value;    TreeNode* children[2];}; => layout(1, 2);*/

其次是结构体的对齐大小,结构体的对齐大小和对齐大小最大的那个字段保持一致。

static constexpr size_t alignment() {    return std::ranges::max({ alignof(Ts)... });}

再然后是计算每一个字段的offset。

在计算某个字段的时候,我们需要知道上一个字段的offset和size,然后按照当前字段的对齐大小进行对齐。以F1的第二个字段i16为例,上一个字段是i8,由于他是第一个字段,offset为0,size是1个字节,我们可以按照如下公式计算:

\[ next = (current + align - 1) \mod align\]

举个例子,假设我们是十进制并且按照10字节对齐,当前面有1个字节被占用的时候,我们需要填充9个字节,当前面有2个字节被占用的时候,我们需要填充8个字节,依次类推,当前面有10个字节都被占用的时候,我们不需要填充字节。

constexpr size_t align(size_t n, size_t m) {     assert(std::popcount(m) == 1 && "m should be power of two.");    return (n + m - 1) & ~(m - 1); }template constexpr size_t offset() const{    static_assert(N < NumSizes);    if constexpr (N == 0)    {        return 0;    }    else    {        const auto last_type_size = sizeof(std::tuple_element_t>);        const auto current_type_alignment = alignof(std::tuple_element_t>);        return detail::align(offset() + last_type_size * m_sizes[N - 1], current_type_alignment);    }}

最后是结构体的大小。我们只需要知道最后一个字段的offset,大小以及填充字节大小就可以了,需要注意的是,最后一个字节也是可能会填充的,这样在申请数组的时候才能保证每一个元素都是对齐的。

constexpr size_t alloc_size() const{    return offset() + sizeof(std::tuple_element_t>) * m_sizes[NumTypes - 1];}

题外话

结构体的字段的分布对布局是有影响的,如果我们更改F1字段的顺序,那么它的大小可能会发生变化。

struct F2{                  //   alignment  sizeof     int8_t i8;    //      1          1    double f64;   //      8       int16_t i16;  //      2          2};static_assert(alignof(F2) == 8);static_assert(sizeof(F2) == 24);

如果您想更好地回顾关于结构体对齐的知识,可以参见https://www.youtube.com/watch?v=SShSV_iV1Ko。

参考文献

[1]维基百科:https://en.wikipedia.org/wiki/Data_structure_alignment

关键词: