malloc源码分析—sysmalloc
本章主要分析sysmalloc
的代码,在《malloc源码分析—__int_malloc》中已经分析了部分sysmalloc
的代码,主要用于对分配区进行初始化。本章查看余下的代码,
第一部分
|
|
首先,old_top
、old_size
和old_end
分别保存了top chunk的指针,大小以及尾部的地址。
如果是非主分配区,首先通过heap_for_ptr
获得原top chunk对应的heap_info
指针,
|
|
对于非主分配区,因为每个heap是按照HEAP_MAX_SIZE
的大小分配且对齐的,而每个topchunk存在于每个heap的剩余空间(高地址处),因此通过heap_for_ptr
就能取出heap_info
指针,heap_info
保存了每个heap的相关信息。获得heap_info
指针后,就能获得该heap当前被使用的大小并将其保存在old_heap_size
中。
根据《malloc源码分析—4》,进入到sysmalloc前会尝试在top chunk分配内存,因此代码执行到这里肯定失败了。所以这里只有MINSIZE + nb - old_size>0
这一种情况,即这时的top chunk空间不足了,因此首先通过grow_heap
尝试向heap的高地址处增加heap当前使用的大小,即top chunk的大小,
|
|
这段代码其实最关键的是h->size = new_size
这一样,表示重新设置heap的大小至new_size
。
回到sysmalloc中,假设grow_heap
成功,即将top chunk的大小设置为MINSIZE + nb
,则重新设置分配区使用的内存大小,并且设置top chunk的size
至新值(注意这里的size
不能直接设置为MINSIZE + nb
是因为在grow_heap
中有对齐操作)。
假设grow_heap
失败,大部分情况下说明heap的使用大小已经接近其最大值HEAP_MAX_SIZE
了,此时只能通过new_heap
重新分配一个heap,注意传入的参数mp_.top_pad
表示在分配内存时,额外多分配的内存。
|
|
首先对需要分配的内存大小size做相应的调整。aligned_heap_area
表示上一次MMAP
分配后的结束地址,如果存在,就首先尝试从该地址分配大小为HEAP_MAX_SIZE
的内存。MMAP
最后是系统调用,对应的内核函数在《malloc源码分析—2》中已经介绍过了,这里只是一些标志位的区别。分配完后,会检查地址是否对齐,如果不对齐也是失败。
如果第一次分配失败了,就会再尝试一次,这次分配HEAP_MAX_SIZE*2
大小的内存,并且新内存的起始地址由内核决定。因为尝试分配了HEAP_MAX_SIZE*2
大小的内存,其中必定包含了大小为HEAP_MAX_SIZE
且和HEAP_MAX_SIZE
对齐的内存,因此一旦分配成功,就从中截取出这部分内存。
如果连第二次也分配失败了,就会通过MMAP
进行第三次分配,这次只分配HEAP_MAX_SIZE
大小的内存,并且起始地址由内核决定,如果又失败了就返回0。
如果三面三次分配内存任何一次成功,就设置相应的可读写位置,并且返回分配区的heap_info
指针。
重新回到sysmalloc
中,假设分配成功,就会对刚刚分配得到的heap做相应的设置,其中ar_ptr
表示所属的分配区的指针,prev
表示上一个heap,所有的heap通过prev
形成单向链表,然后通过set_head
设置av分配区top chunk的size
,这里也可以看出,对于刚分配的heap,包含了heap_info
指针、top chunk、以及大于size的未被使用的部分。
再接下来就要对原来的top chunk进行最后的处理,这里假设对齐,如果原top chunk的大小不够大,就将其分割成old_size + 2 * SIZE_SZ
和2 * SIZE_SZ
大小;如果原top chunk的大小足够大,就将其分割成old_size
,2 * SIZE_SZ
和2 * SIZE_SZ
大小,并通过_int_free
进行释放。
第二部分
继续往下看sysmalloc
,上面一部分代码主要是针对非主分配区的操作,下面的这段代码就是针对主分配区的操作了。
|
|
MORECORE
是一个宏定义,其最终是通过系统调用分配内存,定义在linux内核的mmap.c文件中,
|
|
首先会对传入堆的新地址brk
做一些检查,然后该新地址小于原本的brk
,就需要通过do_munmap
释放虚拟内存,以减少堆的大小;反之,就通过do_brk
增加堆得大小。其中find_vma_intersection
用来判断增加堆空间后,是否会占用已经被分配的虚拟内存,
|
|
因为是增加堆的大小,因此只需要关心do_brk
函数,
|
|
这段代码和第二章中分析的mmap_region
函数很类似,这里简单分析如下,get_unmapped_area
用来检查需要分配的虚拟内存地址是否已经被使用,find_vma_links
用来查找需要插入的虚拟内存在红黑树的位置,may_expand_vm
用来检查虚拟内存是否会超过系统的限制,vma_merge
用来合并虚拟内存,如果不能合并,就通过slab分配一个vma
,进行相应的设置,并通过vma_link
插入到进程的红黑树中。
从linux的代码中回来,继续看sysmalloc
,假设分配成功,会查找是否有__after_morecore_hook
函数并执行,这里假设该函数指针为null。
假设分配失败,则进入else
部分,首先对需要分配的大小按地址对齐,并且设置分配size
的最小值为MMAP_AS_MORECORE_SIZE
(1MB),然后通过MMAP
宏分配内存,该函数已经在《malloc源码分析—2》分析过了。这里注意,如果是通过mmap分配的内存,则设置分配区为不连续标志位。
第三部分
继续往下看sysmalloc,
|
|
假设增加了主分配区的top chunk成功,则更新sbrk_base
和分配区已分配的内存大小。
然后,第一个判断表示,新分配的内存地址和原来的top chunk
连续,并且不是通过MMAP
分配的,这时只需要更新原来top chunk的大小size
。
第二个判断表示如果分配区的连续标志位置位,top chunk的大小大于0,但是分配的brk
小于原来的top chunk结束地址,这里就判定出错了。
进入第三个判断表示新分配的内存地址大于原来的top chunk的结束地址,但是不连续。这种情况下,如果分配区的连续标志位置位,则表示不是通过MMAP分配的,肯定有其他线程调用了brk
在堆上分配了内存,av->system_mem += brk - old_end
表示将其他线程分配的内存一并计入到该分配区分配的内存大小。然后将刚刚分配的地址brk
按MALLOC_ALIGNMENT
对齐。
再往下就要处理地址不连续的问题了,因为地址不连续,就要放弃原来top chunk后面一部分的内存大小,并且将这一部分内存大小“补上”到刚刚分配的新内存后面。首先计算堆上补上内存后的结束地址并保存在correction
中,然后调用MORECORE
继续分配一次,将新分配内存的开始地址保存在snd_brk
中。如果分配失败,则将correction
设为0,并将snd_brk
重置为原来分配的内存的结束地址,表示放弃该次补偿操作;如果分配成功,就调用__after_morecore_hook
函数,这里假设该函数指针为null
。
第四部分
继续往下看sysmalloc,
|
|
开头的else
表示分配区的连续标志没有置位,这时只要按照MALLOC_ALIGNMENT
做简单的对齐就行了,如果是通过brk
分配的内存,则通过MORECORE (0)
得到新分配的内存的结束地址并保存在snd_brk
中。
再往下进入if
,设置分配区的top指针为经过对齐之后的起始地址aligned_brk
,设置top chunk的大小size
,aligned_brk
表示对齐造成的误差,correction
是因为要补偿原来top chunk剩余内存造成的误差,然后设置分配区已分配的内存大小。
因为不连续,最后if
内是设置原top chunk的fencepost
,将原来top chunk的剩余空间拆成两个SIZE_SZ*2
大小的chunk,如果剩下的大小大于可分配的chunk的最小值MINSIZE
,就通过_int_free
释放掉整个剩余内存。
第五部分
继续往下看sysmalloc最后一部分,
|
|
这里就是获得前面所有代码更新后的top chunk,然后从该top chunk中分配用户需要的大小chunk并返回,如果失败则返回0。
总结
简单总结一下sysmalloc
函数,这里不包含《malloc源码分析—__int_malloc》中的代码,该代码用于初始化。首先进入sysmalloc
函数就表示top chunk的空间不够了。
假设当前分配区不是主分配区,就通过grow_heap
增加top chunk的空间,如果失败就通过new_heap
重新分配一个heap,并将该分配区的top chunk指针指向新分配的heap的空闲内存。
如果当前分配区是主分配区,首先会通过brk
在堆上分配内存以增加top chunk的空间,如果失败再通过MMAP
分配。假设新分配内存的地址不连续,而分配区的连续标志位置位,就会继续分配内存以补偿。
最后,只要分配成功,就可以从被更新的top chunk分配所需的内存。