“把BUG当特性,真是见鬼了!”Linux之父痛斥文件系统「大小写不敏感」:这是天大的错误

“把BUG当特性,真是见鬼了!”Linux之父痛斥文件系统「大小写不敏感」:这是天大的错误

在开源圈中,Linus Torvalds 发火的场面,总能引发一阵“小型地震”。

近日,这位 Linux 之父又一次开炮了——这回,目标直指文件系统开发中的老大难问题:大小写不敏感(case-insensitive,即不区分字符的大小写)。他不仅痛批这种设计是“天大的错误”,连带着 Bcachefs 项目的维护者 Kent Overstreet 也被一通狂怼。

为什么一个看似简单的“大小写问题”会引发 Linus 如此强烈的反应?事情还要从 Bcachefs 最近提交的一个修复补丁说起……

Bcachefs 的修复补丁触发争议

进入正题前,先扫个盲:Bcachefs 是一种用于 Linux 操作系统的写时复制(COW)文件系统,由首席开发者 Kent Overstree 在 2015 年发布。

早在近两年前,来自 Valve/Linux 的一位开发者就曾为 Bcachefs 提交了关于大小写折叠(case folding)/大小写不敏感文件和目录支持的补丁,这一功能随后被合入了 Bcachefs 的内核驱动中。但开发者们发现,这套大小写不敏感机制实际上根本没能正常工作。

为了解决这个长期存在的问题,Bcachefs 开发团队在 Linux 6.15-rc4 发布前夕,提交了新的修复补丁,终于让大小写不敏感的目录支持真正生效。

而在此次提交中,Bcachefs 项目的主开发者 Kent Overstreet 特地附上了一段长篇备注,坦言这次失误背后的深层教训。他提到,当初与负责开发的同事沟通时,虽然提醒过“fstests 套件中应包含相关测试”,但他忽略了强调“必须确保这些测试真正执行过”这一点,从而导致了问题潜伏至今。

Kent Overstreet总结道:

仅仅依赖自动化测试是不够的,你必须亲眼确认自己的代码实际在做什么。也就是说,在你彻底熟悉手头代码和测试套件之前,你需要亲自‘用眼睛看’,确认测试确实按你预期的方式运行,你的代码也确实按你预期的逻辑在执行。

如果你对代码行为还有一丝不确定,就必须主动深入验证——加上 printk 日志、tracepoint 跟踪点、计数器,或者用任何其他手段都可以。自动化测试只是一个兜底机制,并不是万无一失的保障。你一定要在本地运行自己的代码,并亲自观察结果。

jrhz.info

仅仅依赖自动化测试是不够的,你必须亲眼确认自己的代码实际在做什么。也就是说,在你彻底熟悉手头代码和测试套件之前,你需要亲自‘用眼睛看’,确认测试确实按你预期的方式运行,你的代码也确实按你预期的逻辑在执行。

如果你对代码行为还有一丝不确定,就必须主动深入验证——加上 printk 日志、tracepoint 跟踪点、计数器,或者用任何其他手段都可以。自动化测试只是一个兜底机制,并不是万无一失的保障。你一定要在本地运行自己的代码,并亲自观察结果。

可以看出,这次 Bcachefs 这次的修复不仅是功能完善,也更像是一次深刻的工程管理反思。

Linus 怒了:大小写不敏感本身就是错误

不过,这件事到了 Linus Torvalds 这里,就不仅仅是测试流程疏忽的问题了——他从更根本的层面,直接对大小写不敏感文件系统的理念发起了猛烈攻击。

在 Linux 内核邮件列表(LKML)上,Linus 写道:“唯一的教训就是:文件系统开发者从来学不会。 大小写不敏感的命名,本身就是天大的错误,根本就不应该去做。问题不是测试做得不够,而是一开始就不该去实现它。”

在 Linus 看来,试图“正确地”实现大小写不敏感,只会导致更多不可控的后果。因为 Unicode 编码标准本身就很复杂,包含了大量的特殊字符、不可打印字符和可忽略字符(ignorable code points),试图在这样一个体系上做到“大小写折叠正确”,几乎是不可能的。

更严重的是,一旦处理得不好,就会引发严重的安全问题。

Linus 举了一个具体的例子:❤ 和 ❤️表面上看非常相似,但实际上是不同的编码。如果大小写折叠逻辑一刀切地忽略这类细节,那么这两个文件名就会被错误地认为是“相同的”——这不仅仅是名字混淆,更会让原本基于字符串检查机制(如验证路径是否安全)的用户空间程序失效,引发安全漏洞。

对于这种潜在风险,Linus 毫不留情地评价:“于是,每一个在用户态中通过文件名检查来保护路径的程序,基本上都能被这种机制骗过,执行了它们明明不该做的操作。 这绝不是小概率事件——有大量程序正是这么工作的。”

在帖子最后,除了点名批评 Bcachefs 项目,Linus 还顺势讽刺了那些怀念老式 FAT 文件系统的人(FAT 文件系统是早期 PC 时代常见的文件系统,但在现代计算环境中,这种设计早已被证明存在大量问题,尤其在安全性和一致性方面表现糟糕):

真是见鬼了。大小写不敏感,本质上就是个 BUG,文件系统开发者们居然到今天还把它当作一个‘特性’,我完全无法理解。这种行为简直像是,他们对古老的 FAT 文件系统怀有一种变态的崇拜,非得一遍又一遍地把这种糟糕设计复制出来——而且每次都做得更烂。

真是见鬼了。大小写不敏感,本质上就是个 BUG,文件系统开发者们居然到今天还把它当作一个‘特性’,我完全无法理解。这种行为简直像是,他们对古老的 FAT 文件系统怀有一种变态的崇拜,非得一遍又一遍地把这种糟糕设计复制出来——而且每次都做得更烂。

总结来说,在 Linus 看来,所谓“正确实现大小写不敏感”,本质上就是无解的。

开发者对此看法不一

事实上,大小写不敏感文件系统的需求,最早来源于早期 『Windows』(FAT、NTFS)以及 macOS(HFS+)的传统。由于历史兼容性和用户友好性考虑,这些系统允许 File.txt 和 file.TXT 被视为同一个文件。但在 Linux 世界里,从一开始文件系统就是大小写敏感的——File.txt 和 file.txt 是两个完全不同的文件。

近年来,随着跨平台需求增加,部分 Linux 文件系统(如 ext4、F2FS、Btrfs)也陆续引入了可选的大小写不敏感支持。然而正如Linus 所说,盲目追求“兼容”或“方便”,很可能种下难以预料的安全隐患:

(1)性能开销:需要增加更多索引处理逻辑。

(2)标准不统一:Unicode 标准复杂,处理可忽略字符、特殊字符等问题极为棘手。

(3)安全风险:一旦字符串匹配逻辑出现偏差,便可能引发严重的访问控制失效。

对于此次 Linus 的言论,不少开发者表示强烈支持:

  • “编程的话大小写变量是不同的变量,确实很重要。”

  • “刚刚遇到一个『Windows』上大小写不敏感的文件覆盖问题,这个的确是设计不合理。”

  • “真正问题是不统一,因为有的领域区分大小写,有的领域却不区分。当然从字符本身的需求而言,肯定是统一强制区分大小写更省事。”

“编程的话大小写变量是不同的变量,确实很重要。”

“刚刚遇到一个『Windows』上大小写不敏感的文件覆盖问题,这个的确是设计不合理。”

“真正问题是不统一,因为有的领域区分大小写,有的领域却不区分。当然从字符本身的需求而言,肯定是统一强制区分大小写更省事。”

但也 有部分开发者认为,强制区分大小写并不是什么好主意:

  • “我将继续坚持我对区分大小写的文件系统的厌恶,因为我不得不在 ssh 控制台会话中处理一堆文件,其中每个目录都有数十个文件,这些文件仅在大小写上都有所不同。”

“我将继续坚持我对区分大小写的文件系统的厌恶,因为我不得不在 ssh 控制台会话中处理一堆文件,其中每个目录都有数十个文件,这些文件仅在大小写上都有所不同。”

特别声明:[“把BUG当特性,真是见鬼了!”Linux之父痛斥文件系统「大小写不敏感」:这是天大的错误] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

特朗普将出席柯克追悼会 告别仪式定于亚利桑那州举行(特朗普kag)

『美国总统特朗普』计划于9月21日出席在亚利桑那州举行的右翼活动人士查理·柯克的告别仪式。特朗普表示,失去了一位伟大的人物,并将在周日清晨前往亚利桑那,乘坐总统专机带几个人一同前往。告别仪式将在格兰代尔市的一座体育场举行

特朗普将出席柯克追悼会 告别仪式定于亚利桑那州举行(特朗普kag)

他曾登过春晚7次,现在成“全网通缉”,师傅『赵本山』也救不了他(登上春晚)

在『赵本山』的引领下,程野不仅在舞台表演上取得了巨大进步,也逐渐学会了如何处理名利,如何与观众互动。程野眼看着自己倾注心血的作品就这样失败了,内心充满了挫败感和沮丧。他意识到自己对电影行业的理解还远远不够,仅凭…

他曾登过春晚7次,现在成“全网通缉”,师傅『赵本山』也救不了他(登上春晚)

新版槟榔汁饮料揭秘:你喝的到底是“果汁”还是“泥膏”?(槟榔果汁)

你是否好奇,市面上标榜“纯天然槟榔汁”的饮品,究竟是怎么做的?本文深度拆解新版槟榔汁饮料、槟榔泥膏、槟榔果汁的制作工艺与核心技术,解析其背后的专利加工技术,揭开“口感浓醇”的真相。从原料筛选到风味保留,从行业标准到选购避坑指南,带你理性看待

新版槟榔汁饮料揭秘:你喝的到底是“果汁”还是“泥膏”?(槟榔果汁)

怎么判断自己是否得了抑郁症(怎么判断自己是不是发烧了)

判断自己是否得了抑郁症可以通过情绪持续低落、兴趣减退、睡眠障碍、食欲改变、自我否定等核心症状初步评估。抑郁症通常由遗传因素、环境压力、神经递质失衡、躯体疾病、心理创伤等原因引起,需要结合专业心理量表评估及精神科医生诊断确认

怎么判断自己是否得了抑郁症(怎么判断自己是不是发烧了)

谁信这是刚生娃?『杨采钰』32岁裹厚衣战高温,何超莲穿连衣裙👗却输得没脾气(谁信这是刚生的孩子)

她穿了件白色连衣裙👗,料子轻得风一吹就飘,按理说该比『杨采钰』凉快,可一到镜头前,拘谨感就藏不住了:攥着裙摆的手指悄悄用力,笑的时候会下意识低头,连下巴的线条都绷着,像刚被老师叫到讲台发言的学生,手都不知道往哪儿放…

谁信这是刚生娃?『杨采钰』32岁裹厚衣战高温,何超莲穿连衣裙👗却输得没脾气(谁信这是刚生的孩子)