nginx内存池源码设计

科技绿洲 2023-11-13 694

描述

造轮子内存池原因引入

作为C/C++程序员, 相较JAVA程序员的一个重大特征是我们可以直接访问内存, 自己管理内存, 这个可以说是我们的特色, 也是我们的苦楚了.

java可以有虚拟机帮助管理内存, 但是我们只能自己管理内存, 一不小心产生了内存泄漏问题, 又特别是服务器的内存泄漏问题, 进程不死去, 泄漏的内存就一直无法回收.

所以对于内存的管理一直是我们C系列程序员深挖的事情.

所以对于C++有智能指针这个东西. 还有内存池组件. 内存池组件也不能完全避免内存泄漏, 但是它可以很好的帮助我们定位内存泄漏的点, 以及可以减少内存申请和释放的次数, 提高效率

大量的malloc/free小内存所带来的弊端

弊端

malloc/free的底层是调用系统调用, 这两者库函数是对于系统调用的封装, 频繁的系统调用所带来的用户内核态切换花费大量时间, 大大降低系统执行效率
频繁的申请小内存, 带来的大量内存碎片, 内存使用率低下且导致无法申请大块的内存
没有内存回收机制, 很容易造成内存泄漏

内存碎片出现原因解释

内部内存碎片定义: 已经被分配出去了(明确分配到一个进程), 但是无法被利用的空间
内存分配的起始地址一定要是 4, 8, 16整除地址
内存是按照页进行分配的, 中间会产生外部内存碎片, 无法分配给进程
内部内存碎片：频繁的申请小块内存导致了内存不连续性，中间的小内存间隙又不足以满足我们的内存申请要求, 无法申请出去利用起来, 这个就是内部内存碎片.

出现场景

最为典型的场景就是高并发是的频繁内存申请, 释放. (http请求) (tcp连接)

大牛解决措施(nginx内存池)

nginx内存池, 公认的设计方式非常巧妙的一款内存池设计组件, 专门针对高并发下面的大量的内存申请释放而产生的.

在系统层，我们可以使用高性能内存管理组件 Tcmalloc Jemalloc（优化效率和碎片问题）

在应用层: 我们可以根据需求设计内存池进行管理 (高并发可以借助nginx内存池设计)

内存池技术

啥叫作内存池技术

就是说在真正使用内存之前, 先提前申请分配一定数量的、大小相等(一般情况下)的内存块留作备用，当需要分配内存的时候, 直接从内存块中获取. 如果内存块不够了, 再申请新的内存块.

内存池：就是将这些提前申请的内存块组织管理起来的数据结构

优势何在：统一对程序所使用的内存进行统一的分配和回收, 提前申请的块, 然后将块中的内存合理的分配出去, 极大的减少了系统调用的次数. 提高了内存利用率. 统一的内存分配回收使得内存泄漏出现的概率大大降低

内存池技术为啥可以解决上文弊端

高并发时系统调用频繁(malloc free频繁)，降低了系统的执行效率

内存池提前预先分配大块内存，统一释放，极大的减少了malloc 和 free 等函数的调用。

频繁使用时增加了系统内存的碎片，降低内存使用效率

内存池每次请求分配大小适度的内存块，最大避免了碎片的产生

没有内存回收机制，容易造成内存泄漏

在生命周期结束后统一释放内存，极大的避免了内存泄露的发生

高并发内存池nginx内存池源码刨析

啥是高并发

系统能够同时并行处理很多请求就是高并发

高并发具备的特征

响应时间短
支持并发用户数高
支持用户接入量高
连接建立时间短

nginx_memory_pool为啥就适合高并发

内存池生存时间应该尽可能短，与请求或者连接具有相同的周期

减少碎片堆积和内存泄漏

避免不同请求连接之间互相影响

一个连接或者一个请求就创建一个内存池专门为其服务, 内存池的生命周期和连接的生命周期保持一致.

仿写nginx内存池

实现思路

对于每个请求或者连接都会建立相应的内存池，建立好内存池之后，我们可以直接从内存池中申请所需要的内存，不用去管内存的释放，当内存池使用完成之后一次性销毁内存池。
区分大小内存块的申请和释放，大于内存池块最大尺寸的定义为大内存块，使用单独的大内存块链表保存，即时分配和释放
小于等于池尺寸的定义为小内存块，直接从预先分配的内存块中提取，不够就扩充池中的内存，在生命周期内对小块内存不做释放，直到最后统一销毁。

内存池大小, 以及内存对齐的宏定义

#define MP_ALIGNMENT       		32
#define MP_PAGE_SIZE			4096
#define MP_MAX_ALLOC_FROM_POOL	(MP_PAGE_SIZE-1)

#define mp_align_ptr(p, alignment) (void *)((((size_t)p)+(alignment-1)) & ~(alignment-1))
//分配内存起点对齐

结构定义以及图解分析

typedef struct mp_large_s {
    struct mp_large_s* next;
    void* alloc;//data区
} mp_large_s;

typedef struct mp_node_s {
    unsigned char* last;//下一次内存分配的起点
    unsigned char* end;//当前内存块末尾
    size_t failed;//当前内存块分配失败的次数
    struct mp_node_s* next;
} mp_node_s;

typedef struct mp_pool_s {
    mp_large_s* large;//指向大块内存起点
    mp_node_s* current;//指向当前可分配的小内存块起点
    int max;//小块最大内存
    mp_node_s head[0];//存储地址, 不占据内存,变长结构体技巧
    //存储首块小内存块head地址
} mp_pool_s;

mp_pool_s 内存池结构

large 指向第一个大块
current 指向当前可分配的小块
head 始终指向第一块小块

mp_node_s 小块内存结构

last 下一次内存分配的起点, 本次内存分配的终点
end 块内存末尾
failed 当前内存块申请内存的失败次数, nginx采取的方式是失败次数达到一定程度就更换current，current是开始尝试分配的内存块, 也就是说失败达到一定次数, 就不再申请这个内存块了.

mp_large_s 大块内存块

正常的申请, 然后使用链表连接管理起来.
alloc 内存块, 分配内存块

函数原型以及功能叙述

//函数申明
mp_pool_s *mp_create_pool(size_t size);//创建内存池
void mp_destory_pool( mp_pool_s *pool);//销毁内存池
void *mp_alloc(mp_pool_s *pool, size_t size);
//从内存池中申请并且进行字节对齐
void *mp_nalloc(mp_pool_s *pool, size_t size);
//从内存池中申请不进行字节对齐
void *mp_calloc(mp_pool_s *pool, size_t size);
//模拟calloc
void mp_free(mp_pool_s *pool, void *p);
void mp_reset_pool(struct mp_pool_s *pool);
//重置内存池
static void *mp_alloc_block(struct mp_pool_s *pool, size_t size);
//申请小块内存
static void *mp_alloc_large(struct mp_pool_s *pool, size_t size);
//申请大块内存

对应nginx函数原型

重点函数分块细节刨析

mp_create_pool: 创建线程池

第一块内存: 大小设置为 size + sizeof(node) + sizeof(pool) ?

mp_node_s head[0] 啥意思?

mp_pool_s* mp_create_pool(size_t size) {
    struct mp_pool_s *p = NULL;
	int ret = posix_memalign((void **)&p, MP_ALIGNMENT, size + sizeof(mp_pool_s) + sizeof(mp_node_s));
	if (ret) {
		return NULL;
	}
	//内存池小块的大小限制
	p- >max = (size < MP_MAX_ALLOC_FROM_POOL) ? size : MP_MAX_ALLOC_FROM_POOL;
	p- >current = p- >head;//第一块为当前块
	p- >large = NULL;

	p- >head- >last = (unsigned char *)p + sizeof( mp_pool_s) + sizeof(mp_node_s);
	p- >head- >end = p- >head- >last + size;
	p- >head- >failed = 0;

	return p;
}

看完了代码来回答一下问题

为了尽可能地避免内存碎片地产生, 小内存地申请, 于是我采取地方式是将 memory pool内存池也放入到首块内存中地方式. 同时所有地node结点信息也都统一存储在每一个内存块中.
head[0] : 是一种常用于变长结构体地技巧, 不占用内存, 仅仅只是表示一个地址信息, 存储head node 的地址.

mp_alloc 带字节对齐的内存申请

首先按照size大小选择内存分配方式, 小于等于线程池小块最大大小限制就从已有小块中申请, 小块不足就调用mp_alloc_block创建新的小块否则就调用 mp_alloc_large 申请创建一个大块内存

mp_align_ptr 用于字节对齐

void *mp_alloc(mp_pool_s *pool, size_t size) {
    mp_node_s* p = NULL;
    unsigned char* m = NULL;
    if (size <= MP_MAX_ALLOC_FROM_POOL) {//从小块中分配
        p = pool- >current;
        do {//循环尝试从现有小块中申请
            m = mp_align_ptr(p- >last, MP_ALIGNMENT);
            if ((size_t)(p- >end - m) >= size) {
                p- >last = m + size;
                return m;  
            }
            p = p- >next;
        } while (p);
        //说明小块中都分配失败了, 于是从新申请一个小块
        return mp_alloc_block(pool, size);
    }
    //从大块中分配
    return mp_alloc_large(pool, size);
}

mp_alloc_block 申请创建新的小块内存

psize 大小等于mp_node_s结点内存大小 + 实际可用内存块大小

搞清楚内存块组成：结点信息 + 实际可用内存块

返回的内存是实际可用内存的起始地址

//申请小块内存
void *mp_alloc_block(struct mp_pool_s *pool, size_t size) {
    unsigned char* m = NULL;
    size_t psize = 0;//内存池每一块的大小
    psize = (size_t)((unsigned char*)pool- >head- >end - (unsigned char*)pool- >head);
    int ret = posix_memalign((void**)&m, MP_ALIGNMENT, psize);
    if (ret) return NULL;
    //此时已经分配出来一个新的块了
    mp_node_s* new_node, *p, *current;
    new_node = (mp_node_s*)m;

    new_node- >end = m + psize;
    new_node- >failed = 0;
    new_node- >next = NULL;

    m += sizeof(mp_node_s);//跳过node
    //对于m进行地址起点内存对齐
    m = mp_align_ptr(m, MP_ALIGNMENT);
    new_node- >last = m + size;

    current = pool- >current;
    //循环寻找新的可分配内存块起点current
    for (p = current; p- >next; p = p- >next) {
        if (p- >failed++ > 4) {
            current = p- >next;
        }
    }
    //将new_node连接到最后一块内存上, 并且尝试跟新pool- >current
    pool- >current = current ? current : new_node;
    p- >next = new_node;
    return m;
}

mp_alloc_large 申请创建新的大块内存

大块内存参考nginx_pool 采取采取的是malloc分配

先分配出来所需大块内存. 在pool的large链表中寻找是否存在空闲的alloc. 存在则将内存挂在上面返回. 寻找5次还没有找到就另外申请一个新的large结点挂载内存, 链接到large list中管理

mp_large_s* node 是从内存池中分配的, 也就是从小块中分配的 why？减少内存碎片, 将大块的node信息放入小块内存中，避免小内存的申请, 减少内存碎片

留疑? 空闲的alloc从何而来？

void *mp_alloc_large(struct mp_pool_s *pool, size_t size) {
    void* p = malloc(size);
    if (p == NULL) return NULL;
    mp_large_s* l = NULL;
    size_t cnt = 0;

    for (l = pool- >large; l; l = l- >next) {
        if (l- >alloc) {
            l- >alloc = p;
            return p;
        }
        if (cnt++ > 3) {
            break;//为了提高效率, 检查前5个块, 没有空闲alloc就从新申请large
        }
    }
 	l = mp_alloc(pool, sizeof(struct mp_large_s));
	if (l == NULL) {
		free(p);
		return NULL;
	}

    l- >alloc = p;
    l- >next = pool- >large;
    pool- >large = l;
    return p;
}

空闲的alloc是被free掉了空闲出来的. 虽然nginx采取的是小块不单独回收, 最后统一回收, 因为小块的回收非常难以控制, 不清楚何时可以回收. 但是对于大块nginx提供了free回收接口.

mp_free_large 回收大块内存资源

void mp_free_large(mp_pool_s *pool, void *p) {
    mp_large_s* l = NULL;
    for (l = pool- >large; l; l = l- >next) {
        if (p == l- >alloc) {
            free(l- >alloc);

            l- >alloc = NULL;
            return ;
        }
    }

}

整体代码附下

#ifndef _MPOOL_H_
#define _MPOOL_H_

#include < stdlib.h >
#include < stdio.h >
#include < string.h >
#include < unistd.h >
#include < fcntl.h >

#define MP_ALIGNMENT       		32
#define MP_PAGE_SIZE			4096
#define MP_MAX_ALLOC_FROM_POOL	(MP_PAGE_SIZE-1)

#define mp_align_ptr(p, alignment) (void *)((((size_t)p)+(alignment-1)) & ~(alignment-1))
//内存起点对齐

typedef struct mp_large_s {
    struct mp_large_s* next;
    void* alloc;//data区
} mp_large_s;

typedef struct mp_node_s {
    unsigned char* last;//下一次内存分配的起点
    unsigned char* end;//当前内存块末尾
    size_t failed;//当前内存块分配失败的次数
    struct mp_node_s* next;
} mp_node_s;

typedef struct mp_pool_s {
    mp_large_s* large;//指向大块内存起点
    mp_node_s* current;//指向当前可分配的小内存块起点
    int max;//小块最大内存
    mp_node_s head[0];//存储地址, 不占据内存,变长结构体技巧
    //存储首块小内存块head地址
} mp_pool_s;

//函数申明
mp_pool_s *mp_create_pool(size_t size);//创建内存池
void mp_destory_pool( mp_pool_s *pool);//销毁内存池
void *mp_alloc(mp_pool_s *pool, size_t size);
//从内存池中申请并且进行字节对齐
void *mp_nalloc(mp_pool_s *pool, size_t size);
//从内存池中申请不进行字节对齐
void *mp_calloc(mp_pool_s *pool, size_t size);
//模拟calloc
void mp_free(mp_pool_s *pool, void *p);
void mp_reset_pool(struct mp_pool_s *pool);
//重置内存池
static void *mp_alloc_block(struct mp_pool_s *pool, size_t size);
//申请小块内存
static void *mp_alloc_large(struct mp_pool_s *pool, size_t size);
//申请大块内存

mp_pool_s* mp_create_pool(size_t size) {
    struct mp_pool_s *p = NULL;
	int ret = posix_memalign((void **)&p, MP_ALIGNMENT, size + sizeof(mp_pool_s) + sizeof(mp_node_s));
	if (ret) {
		return NULL;
	}
	//内存池小块的大小限制
	p- >max = (size < MP_MAX_ALLOC_FROM_POOL) ? size : MP_MAX_ALLOC_FROM_POOL;
	p- >current = p- >head;//第一块为当前块
	p- >large = NULL;

	p- >head- >last = (unsigned char *)p + sizeof( mp_pool_s) + sizeof(mp_node_s);
	p- >head- >end = p- >head- >last + size;
	p- >head- >failed = 0;

	return p;
}

void mp_destory_pool( mp_pool_s *pool) {
    //先销毁大块
    mp_large_s* l = NULL;
    mp_node_s* p = pool- >head- >next, *q = NULL;
    for (l = pool- >large; l; l = l- >next) {
        if (l- >alloc) {
            free(l- >alloc);
            l- >alloc = NULL;
        }
    }
    //然后销毁小块内存
    while (p) {
        q = p- >next;
        free(p);
        p = q;
    }
    free(pool);
}



//申请小块内存
void *mp_alloc_block(struct mp_pool_s *pool, size_t size) {
    unsigned char* m = NULL;
    size_t psize = 0;//内存池每一块的大小
    psize = (size_t)((unsigned char*)pool- >head- >end - (unsigned char*)pool- >head);
    int ret = posix_memalign((void**)&m, MP_ALIGNMENT, psize);
    if (ret) return NULL;
    //此时已经分配出来一个新的块了
    mp_node_s* new_node, *p, *current;
    new_node = (mp_node_s*)m;

    new_node- >end = m + psize;
    new_node- >failed = 0;
    new_node- >next = NULL;

    m += sizeof(mp_node_s);//跳过node
    //对于m进行地址起点内存对齐
    m = mp_align_ptr(m, MP_ALIGNMENT);
    new_node- >last = m + size;
    current = pool- >current;
    for (p = current; p- >next; p = p- >next) {
        if (p- >failed++ > 4) {
            current = p- >next;
        }
    }
    //将new_node连接到最后一块内存上, 并且尝试跟新pool- >current
    pool- >current = current ? current : new_node;
    p- >next = new_node;
    return m;
}

//申请大块内存
void *mp_alloc_large(struct mp_pool_s *pool, size_t size) {
    void* p = malloc(size);
    if (p == NULL) return NULL;
    mp_large_s* l = NULL;
    size_t cnt = 0;

    for (l = pool- >large; l; l = l- >next) {
        if (l- >alloc) {
            l- >alloc = p;
            return p;
        }
        if (cnt++ > 3) {
            break;//为了提高效率, 检查前5个块, 没有空闲alloc就从新申请large
        }
    }
 	l = mp_alloc(pool, sizeof(struct mp_large_s));
	if (l == NULL) {
		free(p);
		return NULL;
	}

    l- >alloc = p;
    l- >next = pool- >large;
    pool- >large = l;
    return p;
}


//带有字节对齐的申请
void *mp_alloc(mp_pool_s *pool, size_t size) {
    mp_node_s* p = NULL;
    unsigned char* m = NULL;
    if (size < MP_MAX_ALLOC_FROM_POOL) {//从小块中分配
        p = pool- >current;
        do {
            m = mp_align_ptr(p- >last, MP_ALIGNMENT);
            if ((size_t)(p- >end - m) >= size) {
                p- >last = m + size;
                return m;  
            }
            p = p- >next;
        } while (p);
        //说明小块中都分配失败了, 于是从新申请一个小块
        return mp_alloc_block(pool, size);
    }
    //从大块中分配
    return mp_alloc_large(pool, size);
}



//不带字节对齐的从内存池中申请内存
void *mp_nalloc(mp_pool_s *pool, size_t size) {
    mp_node_s* p = NULL;
    unsigned char* m = NULL;
    if (size < MP_MAX_ALLOC_FROM_POOL) {//从小块中分配
        p = pool- >current;
        do {
            m = p- >last;
            if ((size_t)(p- >end - m) >= size) {
                p- >last = m + size;
                return m;  
            }
            p = p- >next;
        } while (p);
        //说明小块中都分配失败了, 于是从新申请一个小块
        return mp_alloc_block(pool, size);
    }
    //从大块中分配
    return mp_alloc_large(pool, size);
}


void *mp_calloc(struct mp_pool_s *pool, size_t size) {

	void *p = mp_alloc(pool, size);
	if (p) {
		memset(p, 0, size);
	}

	return p;
	
}

void mp_free(mp_pool_s *pool, void *p) {
    mp_large_s* l = NULL;
    for (l = pool- >large; l; l = l- >next) {
        if (p == l- >alloc) {
            free(l- >alloc);

            l- >alloc = NULL;
            return ;
        }
    }

}

#endif

打开APP阅读更多精彩内容