作为 windows 或 macos 系统用户,人们一般不会去考虑他们的磁盘使用了什么文件系统,因为微软和苹果已经帮他们选定了 ntfs 和 apfs。而对于 linux 用户,受益于自由开源软件,文件系统选择非常多,从常见的 ext 4 文件系统到先进的 btrfs 文件系统,以及专门为闪存设计的 f2fs 文件系统。在了解各个文件系统特性的基础上,大家可以根据自己的需求和使用场景来选择。
linux操作系统对各种文件系统的支持是通过名为vfs的组件实现的,也就是虚拟文件系统(virtual file system)。如下图所示,vfs作为一个抽象层,为用户提供统一的接口,屏蔽了其它具体文件系统(例如ext4和btrfs等)的实现。vfs为用户提供了open、close、read和write等接口。
本文介绍了常见的 linux 文件系统和它们的优缺点,以及使用场合。
ext
ext 是最为流行的 linux 文件系统,最新版本 ext 4 已非常稳定,是过去几年中大多数 linux 发行版的默认选择。从 android 2.3 版开始,ext 4 取代之前的 yaffs 成为默认文件系统。由于使用广泛,加上 google 等大公司背书,ext 4 被认为是成熟稳定的文件系统,适合大多数使用场合,包括 linux 桌面用户。
作为 ext 3 文件系统的升级版本,ext 4 速度和容量都有很大提升,并且 fsck 所需时间大大减少。容量方面,ext 4 支持最大分区 1eb、最大文件 16tb、最大文件数量 40 亿。作为日志文件系统,ext 4 文件系统对文件在磁盘中的位置以及磁盘的任何更改做记录,并使用校验和来提高文件系统的可靠性。不过,ext 4 不支持透明压缩、透明加密、快照等高级功能。
ext 文件系统的核心开发者 theodore ts'o 是一位华裔,目前在 google 工作,他也是 linux 内核和 debian 系统资深开发者。
xfs
xfs 是一种高性能日志文件系统,由 sgi 设计开发,是业界最先进的、最具扩展性的文件系统之一,是目前 centos 的默认文件格式。xfs 擅长处理大文件,在大型文件系统上提供非常高的吞吐量和平滑的数据传输,适合拥有海量数据的用户,在企业应用、大数据领域有着广泛应用。
xfs 文件及目录索引采用 b 树结构,查询与分配存储空间非常快,性能不受目录及文件数量的限制。xfs 文件系统能连续提供快速的反应时间,以接近裸设备 i/o 的性能存储数据,在大多数场景下整体 iops 表现要比 ext 4 来得更高、更稳定,延迟也更小,在高 i/o 压力下尤其明显。xfs 因其基于分配组 (allocation group) 的设计而特别擅长并行 io,当该文件系统跨越多个存储设备时,这种设计使得 io 线程数、文件系统带宽、文件和文件系统大小都具有极大的可伸缩性。
xfs 最大支持 8eb 单个文件。xfs 格式化和挂载非常快,并提供了在线碎片整理功能。xfs 文件系统也有一些不足,例如它不能直接压缩,不支持透明压缩,缺少校验保护等。
reiserfs
reiserfs 文件系统曾是 linux 操作系统上设计最先进、性能最好的文件系统。reiserfs 作为 suse linux enterprise 的默认文件系统,曾受到 novell 公司的力推。
reiserfs 文件系统使用 b* 树存储文件,查找定位文件非常快,用来处理大量小文件非常有优势,一些场合比 ext 4 快上数倍。 表现在个人桌面系统,使用 reiserfs 文件系统能达到更快的开机速度,载入文档、图片也更加快捷。
reiserfs 的作者 hans reiser 是俄裔美国人,他领导的 namesys 公司致力于开发和维护 reiserfs 文件系统。本来 reiserfs 是 linux 平台最有前途的文件系统,不过 2006 年 hans reiser 由于杀妻案入狱,reiserfs 的开发陷入停滞,错过了最好的发展机会。不过,一小部分开发者仍在进行 reiserfs 后续版本的开发,reiser 4 经过全新设计,具备了很多领先的文件系统特性,不过目前还未进入 linux 内核。
btrfs
btrfs 是一种支持写入时复制(cow)的文件系统, 与 zfs 非常类似,被认为是 linux 未来最有希望的文件系统,将替代目前广泛使用的 ext 4 文件系统。btrfs 也宣称专注于「容错、修复及易于管理」。
oracle 于 2007 年对外宣布这项计划,并发布源代码,2014 年 8 月发布稳定版。目标是取代 linux 当时主流的 ext 3 文件系统,摆脱 ext 3 的一些限制,特別是单文件大小,文件系统总大小和文件校验,并加入 ext3 不支持的一些功能,比如可写快照(writable snapshots)、快照的快照(snapshots of snapshots)、内建磁盘阵列(raid),以及子卷(subvolumes)。
btrfs 是少数专门对 ssd 进行优化的文件系统,btrfs 用户可以使用 mount 参数打开对 ssd 的特殊优化处理。btrfs 的 cow 技术从根本上避免了对同一个物理单元的反复写操作,如果用户打开了 ssd 优化选项,btrfs 将在底层的块空间分配策略上进行优化:将多次磁盘空间分配请求聚合成一个大小为 2m 的连续的块。大块连续地址的 io 能够让固化在 ssd 内部的微代码更好的进行读写优化,从而提高 io 性能。
另外还有专门为 nand 闪存设计的 f2fs、yaffs 等文件系统,源自 solaris 号称终极文件系统的 zfs(zfs on linux)等。