碰到一个内存越界,设备起来后不久报错并当机,串口打印为*** glibc detected *** ./server: double free or corruption (!prev): 0x08a03b88 ***
这个头疼的问题,和同事跟踪定位了三天,终于得到解决,下面分析下定位堆越界的过程,由于不在公司,不方便贴出源码及数据,只大概给出粗略的数据和过程:
这个内存越界死机问题,其实已经埋伏了很久,但太过偶现,大家也没注意,最近突然频繁死机,也给了我们定位的契机。double free or corruption (!prev): 0x08a03b88,glibc的这个报错,表示glibc检测到自己的内存头信息已经被破坏。
下面简单描述下ptmalloc的内存模型:
malloc_chunk结构的前两个成员(8字节).一段已分配的内存结构如下图所示:
0 16 32
chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 上一个块的字节数(如果上一个块空闲的话) | |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 当前块的字节数 (size) |M|P|
mem-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 用户数据开始... .
. .
.

本文讲述了如何定位和解决嵌入式Linux系统中的内存越界问题,通过分析glibc错误信息、内存模型、使用gdb调试以及自定义malloc/free来追踪内存分配与释放。在内存越界导致double free时,通过打印堆栈信息和记录调用链,最终定位问题。

2万+

被折叠的 条评论
为什么被折叠?



