还在使用 89 年版 C 语言的 Linux 内核,现在终于要做出改变了。今天,Linux 开源社区宣布,未来会把内核 C 语言版本升级到 C11,预计 5.18 版之后生效,也就是今年 5 月。
这个决定很突然,从发起问题到官方声明,不过才一个星期,要知道说服固执的 Linux 之父 Linus Torvalds 可不是件容易的事。事情的原因,说起来还有那么一点偶然的因素。
一个 bug 的连锁反应
问题的起源是来自上周的一次 Linux 社区讨论。
一位名叫 Jakob Koschel 的博士生,在研究阻止与内核链表 primitive 相关的预测执行漏洞时,发现了这样一个问题。
Linux 内核广泛使用由 struct list_head 定义的双向链表:
struct list_head { struct list_head *next, *prev; };
这种结构通常嵌入到其他结构中。通过这种方式,可以使用任何相关的结构类型制作链表。
除此之外,内核还提供大量可用于遍历和操作链表的函数和宏。list_for_each_entry () 就是其中之一,这是伪装成一种控制结构的宏。问题就出在这个宏上。假设内核包含如下结构:
struct foo { int fooness; struct list_head list; };
list 中的元素可用于创建 foo 结构的双向链表。假设有一个叫做 foo_list 的结构声明作为此类链表的头,使用以下代码可以遍历此链表:
struct foo *iterator; list_for_each_entry(iterator, &foo_list, list) { do_something_with(iterator); } /* Should not use iterator here */
list 参数告诉宏在 foo 结构中 list_head 结构的名称。这个循环将为列表中的每个元素执行一次,迭代器指向该元素。由此导致了 USB 子系统中的一个 bug:传递给该宏的迭代器在退出宏后还能被使用。
这是一件危险的事情,所以 Koschel 提交了一个修复补丁,在循环后停止使用迭代器搞定了 bug。
说服 Linus
但是 Linus Torvalds 本人并不太喜欢这个补丁,也没有看到它与预测执行漏洞的关系。在 Koschel 详细解释后,Linus 承认这只是一个普通的 bug。
然而事情并没有那么简单,Linus 不久后意识到了真正的根源:传递给链表遍历宏的迭代器,必须在循环本身之外的范围内声明。这种非预测性 bug 发生的原因是,C89 中没有“在循环中声明变量”。
像 list_for_each_entry () 这样的宏,从根本上总是将最后一个 HEAD 入口泄漏到循环之外,仅仅是因为我们不能在循环本身中声明迭代器变量。
如果可以编写一个可以声明自己的迭代器列表遍历宏,那么迭代器在循环之外将不可见,并且不会出现此类问题。但是,由于内核停留在 C89 标准上,因此无法在循环中声明变量。
Linus 决定,那咱们还是升级吧,也许是时候转向 C99 标准了。虽然它也有 20 多年的历史,但至少比 C89 新,可以在循环中声明变量。
既然 C89 如此陈旧,这么多年还没做出改变呢?Linus 说,那是因为我们在一些古老的 gcc 编译器版本中遇到了一些奇怪的问题,不能随便升级。
但是,现在 Linux 内核已将 gcc 的更低要求提升至 5.1 版,因此过去那些奇怪的 bug 应该不会有了。
而另一位核心开发者 Arnd Bergmann 认为,咱们完全可以升级到 C11 甚至更高版本。但如果升级到 C17 或 C2x,会破坏对 gcc-5/6/7 的支持,因此升级到 C11 更容易实现。