发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

[讨论]

Linux内核调试方法的总结

2016-5-20 10:30:53 5370 Linux 嵌入式

0 内核开发比用户空间开发更难的一个因素就是内核调试艰难。内核错误往往会导致系统宕机，很难保留出错时的现场。调试内核的关键在于你的对内核的深刻理解。一调试前的准备在调试一个bug之前，我们所要做的准备工作有：有一个被确认的bug。包含这个bug的内核版本号，需要分析出这个bug在哪一个版本被引入，这个对于解决问题有极大的帮助。可以采用二分查找法来逐步锁定bug引入版本号。对内核代码理解越深刻越好，同时还需要一点点运气。该bug可以复现。如果能够找到复现规律，那么离找到问题的原因就不远了。最小化系统。把可能产生bug的因素逐一排除掉。二内核中的bug 内核中的bug也是多种多样的。它们的产生有无数的原因，同时表象也变化多端。从隐藏在源代码中的错误到展现在目击者面前的bug，其发作往往是一系列连锁反应的事件才可能出发的。虽然内核调试有一定的困难，但是通过你的努力和理解，说不定你会喜欢上这样的挑战。三内核调试配置选项学习编写驱动程序要构建安装自己的内核（标准主线内核）。最重要的原因之一是：内核开发者已经建立了多项用于调试的功能。但是由于这些功能会造成额外的输出，并导致能下降，因此发行版厂商通常会禁止发行版内核中的调试功能。 1 为了实现内核调试，在内核配置上增加了几项： Kernel hacking ---> Magic SysRq key Kernel debugging Debug slab memory allocations Spinlock and rw-lock debugging: basic checks Spinlock debugging: sleep-inside-spinlock checking Compile the kernel with debug info Device Drivers ---> Generic Driver Options ---> Driver Core verbose debug messages General setup ---> Configure standard kernel features (for small systems) ---> Load all symbols for debugging/ksymoops 启用选项例如： slab layer debugging（slab层调试选项） high-memory debugging（高端内存调试选项） I/O mapping debugging（I/O映射调试选项） spin-lock debugging（自旋锁调试选项） stack-overflow checking（栈溢出检查选项） sleep-inside-spinlock checking（自旋锁内睡眠选项） 2 调试原子操作从内核2.5开发，为了检查各类由原子操作引发的问题，内核提供了极佳的工具。内核提供了一个原子操作计数器，它可以配置成，一旦在原子操作过程中，进城进入睡眠或者做了一些可能引起睡眠的操作，就打印警告信息并提供追踪线索。所以，包括在使用锁的时候调用schedule()，正使用锁的时候以阻塞方式请求分配内存等，各种潜在的bug都能够被探测到。下面这些选项可以最大限度地利用该特性： CONFIG_PREEMPT = y CONFIG_DEBUG_KERNEL = y CONFIG_KLLSYMS = y CONFIG_SPINLOCK_SLEEP = y 四引发bug并打印信息 1 一些内核调用可以用来方便标记bug，提供断言并输出信息。最常用的两个是BUG()和BUG_ON()。定义在中： #ifndef HAVE_ARCH_BUG #define BUG() do { printk("BUG: failure at %s:%d/%s()! ", __FILE__, __LINE__, __FUNCTION__); panic("BUG!"); /* 引发更严重的错误，不但打印错误消息，而且整个系统业会挂起 / } while (0) #endif #ifndef HAVE_ARCH_BUG_ON #define BUG_ON(condition) do { if (unlikely(condition)) BUG(); } while(0) #endif 当调用这两个宏的时候，它们会引发OOPS，导致栈的回溯和错误消息的打印。 ※ 可以把这两个调用当作断言使用，如：BUG_ON(bad_thing); 2 dump_stack() 有些时候，只需要在终端上打印一下栈的回溯信息来帮助你调试。这时可以使用dump_stack()。这个函数只在终端上打印寄存器上下文和函数的跟踪线索。 if (!debug_check) { printk(KERN_DEBUG “provide some information…/n”); dump_stack(); } 五 printk()* 内核提供的格式化打印函数。 1 printk函数的健壮性健壮性是printk最容易被接受的一个特质，几乎在任何地方，任何时候内核都可以调用它（中断上下文、进程上下文、持有锁时、多处理器处理时等）。 2 printk函数脆弱之处在系统启动过程中，终端初始化之前，在某些地方是不能调用的。如果真的需要调试系统启动过程最开始的地方，有以下方法可以使用：使用串口调试，将调试信息输出到其他终端设备。使用early_printk()，该函数在系统启动初期就有打印能力。但它只支持部分硬件体系。 3 LOG等级 printk和printf一个主要的区别就是前者可以指定一个LOG等级。内核根据这个等级来判断是否在终端上打印消息。内核把比指定等级高的所有消息显示在终端。可以使用下面的方式指定一个LOG级别： printk(KERN_CRIT “Hello, world!n”); 注意，第一个参数并不一个真正的参数，因为其中没有用于分隔级别（KERN_CRIT）和格式字符的逗号（,）。KERN_CRIT 本身只是一个普通的字符串（事实上，它表示的是字符串 "<2>"；表 1 列出了完整的日志级别清单）。作为预处理程序的一部分，C 会自动地使用一个名为字符串串联的功能将这两个字符串组合在一起。组合的结果是将日志级别和用户指定的格式字符串包含在一个字符串中。内核使用这个指定LOG级别与当前终端LOG等级console_loglevel来决定是不是向终端打印。下面是可使用的LOG等级： #define KERN_EMERG "<0>" /* system is unusable / #define KERN_ALERT "<1>" / action must be taken immediately / #define KERN_CRIT "<2>" / critical conditions / #define KERN_ERR "<3>" / error conditions / #define KERN_WARNING "<4>" / warning conditions / #define KERN_NOTICE "<5>" / normal but significant condition / #define KERN_INFO "<6>" / informational / #define KERN_DEBUG "<7>" / debug-level messages / #define KERN_DEFAULT "" / Use the default kernel loglevel */ 注意，如果调用者未将日志级别提供给 printk，那么系统就会使用默认值 KERN_WARNING "<4>"（表示只有 KERN_WARNING 级别以上的日志消息会被记录）。由于默认值存在变化，所以在使用时最好指定LOG级别。有LOG级别的一个好处就是我们可以选择性的输出LOG。比如平时我们只需要打印KERN_WARNING级别以上的关键性LOG，但是调试的时候，我们可以选择打印KERN_DEBUG等以上的详细LOG。而这些都不需要我们修改代码，只需要通过命令修改默认日志输出级别： mtj @ubuntu:~$ cat /proc/sys/kernel/printk 4 4 1 7 mtj @ubuntu:~$ cat /proc/sys/kernel/printk_delay 0 mtj @ubuntu:~$ cat /proc/sys/kernel/printk_ratelimit 5 mtj @ubuntu:~$ cat /proc/sys/kernel/printk_ratelimit_burst 10 第一项定义了 printk API 当前使用的日志级别。这些日志级别表示了控制台的日志级别、默认消息日志级别、最小控制台日志级别和默认控制台日志级别。printk_delay 值表示的是 printk 消息之间的延迟毫秒数（用于提高某些场景的可读性）。注意，这里它的值为 0，而它是不可以通过 /proc 设置的。printk_ratelimit 定义了消息之间允许的最小时间间隔（当前定义为每 5 秒内的某个内核消息数）。消息数量是由 printk_ratelimit_burst 定义的（当前定义为 10）。如果您拥有一个非正式内核而又使用有带宽限制的控制台设备（如通过串口），那么这非常有用。注意，在内核中，速度限制是由调用者控制的，而不是在printk 中实现的。如果一个 printk 用户要求进行速度限制，那么该用户就需要调用 printk_ratelimit 函数。 4 记录缓冲区内核消息都被保存在一个LOG_BUF_LEN大小的环形队列中。关于LOG_BUF_LEN定义： #define __LOG_BUF_LEN (1 << CONFIG_LOG_BUF_SHIFT) ※ 变量CONFIG_LOG_BUF_SHIFT在内核编译时由配置文件定义，对于i386平台，其值定义如下（在linux26/arch/i386/defconfig中）： CONFIG_LOG_BUF_SHIFT=18 记录缓冲区操作： ① 消息被读出到用户空间时，此消息就会从环形队列中删除。 ② 当消息缓冲区满时，如果再有printk()调用时，新消息将覆盖队列中的老消息。 ③ 在读写环形队列时，同步问题很容易得到解决。 ※ 这个纪录缓冲区之所以称为环形，是因为它的读写都是按照环形队列的方式进行操作的。 5 syslogd/klogd 在标准的Linux系统上，用户空间的守护进程klogd从纪录缓冲区中获取内核消息，再通过syslogd守护进程把这些消息保存在系统日志文件中。klogd进程既可以从/proc/kmsg文件中，也可以通过syslog()系统调用读取这些消息。默认情况下，它选择读取/proc方式实现。klogd守护进程在消息缓冲区有新的消息之前，一直处于阻塞状态。一旦有新的内核消息，klogd被唤醒，读出内核消息并进行处理。默认情况下，处理例程就是把内核消息传给syslogd守护进程。syslogd守护进程一般把接收到的消息写入/var/log/messages文件中。不过，还是可以通过/etc/syslog.conf文件来进行配置，可以选择其他的输出文件。[url=][/url] 6 dmesg dmesg 命令也可用于打印和控制内核环缓冲区。这个命令使用 klogctl 系统调用来读取内核环缓冲区，并将它转发到标准输出（stdout）。这个命令也可以用来清除内核环缓冲区（使用 -c 选项），设置控制台日志级别（-n 选项），以及定义用于读取内核日志消息的缓冲区大小（-s 选项）。注意，如果没有指定缓冲区大小，那么 dmesg 会使用 klogctl 的SYSLOG_ACTION_SIZE_BUFFER 操作确定缓冲区大小。 7 注意： a) 虽然printk很健壮，但是看了源码你就知道，这个函数的效率很低：做字符拷贝时一次只拷贝一个字节，且去调用console输出可能还产生中断。所以如果你的驱动在功能调试完成以后做性能测试或者发布的时候千万记得尽量减少printk输出，做到仅在出错时输出少量信息。否则往console输出无用信息影响性能。 b) printk的临时缓存printk_buf只有1K，所有一次printk函数只能记录<1K的信息到log buffer，并且printk使用的“ring buffer”. 8 内核printk和日志系统的总体结构:[url=][/url] 0
2016-5-20 10:30:53　　评论淘帖0 举报相关推荐 • Linux内核调试方法 1385 • Linux内核调试方式以及工具总结 1465 • 学会Linux内核调试方法！ 2344 • Linux内核使用gdb调试 3014 • Linux内核内存规整总结 1319 • Linux：QEMU调试内核的步骤 3150 • Linux 内核：eBPF优势和eBPF潜力总结 3165 • Linux内核调试的方式以及工具集锦 863 • Linux内核学习笔记：printk调试 1155 • Linux内核动态输出调试 539 3 个讨论

0 想要更全的linux资料，可以加扣扣 1765841775，一起学习和交流哦

2016-5-20 10:31:28 评论举报 1^# 梁工

0 学好linux,不是一朝一夕的事情哦，而且最主要的是需要很系统的学习，才可以事半功倍，最好可以接触到较大项目，有丰富项目经验的老师指导，项目在于细节，有很多自学的朋友，觉得自己学得不错了，可是一做项目时往往有很多问题，然后只能百度，但是如果你有老师的指导了，很多的细节告诉你了，你的开发之路会顺畅很多

2016-5-27 11:51:52 评论举报 2^# 梁工

0 谢谢楼主的分享~

2016-6-26 16:34:05 评论举报 3^# 柠檬守护

只有小组成员才能发言，加入小组>>

Linuxwilliam hill官网

1700个成员聚集在这个小组

精选推荐

「含关键代码」基于AM3352/AM3354/AM3359的Linux开发案例分享

4902 浏览 0 评论
丁光宇：善用“兵法”，突破Linux项目开发难点

87422 浏览 0 评论
【高手问答】如何做到精通linux技术？资深工程师带你突破难点

4731 浏览 2 评论
Linux常用必会60个命令实例详解

3628 浏览 2 评论
解读Linux ：先从创建一个文件夹用来存放jdk压缩文件开始

2488 浏览 0 评论

最新话题

热门话题

请教一个OUI相关问题

2012浏览 3评论
有没有大佬用过银河麒麟，进来聊聊

1298浏览 1评论
求解：aarch64交叉编译工具已经安装成功，环境变量已经配置，怎么将系统架构切换为ARM的架构

1354浏览 0评论
电脑和虚拟机可以互ping，电脑和开发板也可以互ping，但是虚拟机和开发板ping不通是什么原因

1241浏览 0评论
求助lpr连续打印图片的时候大概有8秒的延迟如何解决

1180浏览 0评论

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友william hill官网

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回 Linuxwilliam hill官网

回复

关闭

站长推荐 /7

快速回复 返回顶部 返回列表

- 技术社区: HarmonyOS技术社区

RISC-V MCU技术社区

FPGA开发者技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式william hill官网: ARM技术william hill官网

STM32/STM8技术william hill官网

嵌入式技术william hill官网

单片机/MCUwilliam hill官网

RISC-V技术william hill官网

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASICwilliam hill官网

DSPwilliam hill官网

- 威廉希尔官方网站图及DIY: 威廉希尔官方网站设计william hill官网

DIY及创意

电子元器件william hill官网

专家问答

- 电源技术william hill官网: 电源技术william hill官网

无线充电技术

- 综合技术与应用: 机器人william hill官网

USBwilliam hill官网

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信william hill官网: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计william hill官网: PCB设计william hill官网

DigiPCBAwilliam hill官网

Protel|AD|DXPwilliam hill官网

PADS技术william hill官网

Allegrowilliam hill官网

multisimwilliam hill官网

proteuswilliam hill官网 |仿真william hill官网

KiCad EDA 中文william hill官网

DFM|可制造性设计william hill官网

- 测试测量william hill官网: LabVIEWwilliam hill官网

Matlabwilliam hill官网

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋威廉希尔官方网站

time

recommend

hot

post

—
—
—

版
块
导
航