查看: 2861|回复: 12
收起左侧

[系统相关] Linux 之父终于被劝动:用了 30 年的 Linux 内核 C 语言将升级至 C11

[复制链接]
ICzcz
发表于 2022-2-25 14:37:56 | 显示全部楼层 |阅读模式
还在使用 89 年版 C 语言的 Linux 内核,现在终于要做出改变了。今天,Linux 开源社区宣布,未来会把内核 C 语言版本升级到 C11,预计 5.18 版之后生效,也就是今年 5 月。

c6069040-f8f5-4f78-862e-49ef8364b674.png

这个决定很突然,从发起问题到官方声明,不过才一个星期,要知道说服固执的 Linux 之父 Linus Torvalds 可不是件容易的事。事情的原因,说起来还有那么一点偶然的因素。

一个 bug 的连锁反应
问题的起源是来自上周的一次 Linux 社区讨论。

一位名叫 Jakob Koschel 的博士生,在研究阻止与内核链表 primitive 相关的预测执行漏洞时,发现了这样一个问题。

Linux 内核广泛使用由 struct list_head 定义的双向链表:

  1. struct list_head {
  2.     struct list_head *next, *prev;
  3.     };
复制代码


这种结构通常嵌入到其他结构中。通过这种方式,可以使用任何相关的结构类型制作链表。

除此之外,内核还提供大量可用于遍历和操作链表的函数和宏。list_for_each_entry () 就是其中之一,这是伪装成一种控制结构的宏。问题就出在这个宏上。假设内核包含如下结构:

  1. struct foo {
  2.         int fooness;
  3.     struct list_head list;
  4.     };
复制代码

list 中的元素可用于创建 foo 结构的双向链表。假设有一个叫做 foo_list 的结构声明作为此类链表的头,使用以下代码可以遍历此链表:

  1. struct foo *iterator;

  2.     list_for_each_entry(iterator, &foo_list, list) {
  3.         do_something_with(iterator);
  4.     }
  5.     /* Should not use iterator here */
复制代码

list 参数告诉宏在 foo 结构中 list_head 结构的名称。这个循环将为列表中的每个元素执行一次,迭代器指向该元素。由此导致了 USB 子系统中的一个 bug:传递给该宏的迭代器在退出宏后还能被使用。

这是一件危险的事情,所以 Koschel 提交了一个修复补丁,在循环后停止使用迭代器搞定了 bug。

883fe114-cef5-4f83-bfd7-f5ef6797fadd.png

说服 Linus
但是 Linus Torvalds 本人并不太喜欢这个补丁,也没有看到它与预测执行漏洞的关系。在 Koschel 详细解释后,Linus 承认这只是一个普通的 bug。

然而事情并没有那么简单,Linus 不久后意识到了真正的根源:传递给链表遍历宏的迭代器,必须在循环本身之外的范围内声明。这种非预测性 bug 发生的原因是,C89 中没有“在循环中声明变量”。

像 list_for_each_entry () 这样的宏,从根本上总是将最后一个 HEAD 入口泄漏到循环之外,仅仅是因为我们不能在循环本身中声明迭代器变量。

如果可以编写一个可以声明自己的迭代器列表遍历宏,那么迭代器在循环之外将不可见,并且不会出现此类问题。但是,由于内核停留在 C89 标准上,因此无法在循环中声明变量。

Linus 决定,那咱们还是升级吧,也许是时候转向 C99 标准了。虽然它也有 20 多年的历史,但至少比 C89 新,可以在循环中声明变量。

既然 C89 如此陈旧,这么多年还没做出改变呢?Linus 说,那是因为我们在一些古老的 gcc 编译器版本中遇到了一些奇怪的问题,不能随便升级。

f722fcce-e23a-4e9c-87de-00b73bdc78a8.png

但是,现在 Linux 内核已将 gcc 的最低要求提升至 5.1 版,因此过去那些奇怪的 bug 应该不会有了。

而另一位核心开发者 Arnd Bergmann 认为,咱们完全可以升级到 C11 甚至更高版本。但如果升级到 C17 或 C2x,会破坏对 gcc-5/6/7 的支持,因此升级到 C11 更容易实现。

最终,Torvalds 赞成这个想法:“好的,请提醒我,让我们在 5.18 合并窗口的早期尝试一下。”接下来迁移到 C11 可能会导致一些意想不到的 bug,但如果一切顺利,下一个 Linux 内核版本将正式转向 C11。

参考链接:

[1]https://lwn.net/SubscriberLink/885941/01fdc39df2ecc25f/

[2]https://news.ycombinator.com/item?id=30459634

sevenday
发表于 2022-2-25 15:11:59 | 显示全部楼层
完全看不懂这个新闻,
紫仟陌尘
发表于 2022-2-25 15:23:15 | 显示全部楼层
这年头咨询区都快要混不下去了,看个新闻都看不懂。。

评分

参与人数 1人气 +2 收起 理由
独自丶飘零 + 2 赞一个!

查看全部评分

ForeverX
发表于 2022-2-25 15:49:37 | 显示全部楼层
很多开头就定义一大堆变量估计就是从C89传承下来的习惯
dg1vg4
发表于 2022-2-25 15:51:21 | 显示全部楼层
sevenday 发表于 2022-2-25 15:11
完全看不懂这个新闻,

C语言的标准随时间变化,不断进步的,但Linux内核一直停留在89版的C语言标准,为的是保证GCC编译器工作稳定。
但是直到今天一个Bug,将89版C语言标准的缺陷爆露了出来,林纳斯意识到,这么多年过去,Linux内核的C语言版本该升级了。

评分

参与人数 1人气 +3 收起 理由
长乐 + 3 版区有你更精彩: )

查看全部评分

帝辛
发表于 2022-2-25 15:54:47 | 显示全部楼层
升级C17later吧。跟其他软件一样指明不兼容不就行了。不过估计得花大量时间改bug。C语言有点坚挺啊
shine1991
发表于 2022-2-25 17:16:48 | 显示全部楼层
ForeverX 发表于 2022-2-25 15:49
很多开头就定义一大堆变量估计就是从C89传承下来的习惯

那是因为从C99开始才允许变量只要在使用前定义/声明就可以了,之前都是必须在代码块一开始就定义/声明的。
大学时学了C++,后来再用着VC6写C代码,就发现这个不同点了。
Markel.Scofield
发表于 2022-2-25 20:03:07 | 显示全部楼层
能用最新的当然好了
fanitnow
发表于 2022-2-27 16:48:53 | 显示全部楼层
帝辛 发表于 2022-2-25 15:54
升级C17later吧。跟其他软件一样指明不兼容不就行了。不过估计得花大量时间改bug。C语言有点坚挺啊

不知C17是最新版本的C么?
帝辛
发表于 2022-2-28 01:03:13 | 显示全部楼层
fanitnow 发表于 2022-2-27 16:48
不知C17是最新版本的C么?

不是啊。你百度一下就知道了。
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2024-11-24 02:01 , Processed in 0.140355 second(s), 20 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表