HDFS 与 OSS-HDFS

我现在更愿意把 HDFS 看成大数据系统的一块“历史地基”，而不是一个单纯的旧技术名词。它解释了为什么早期数据平台会围绕 block、副本、NameNode 和数据本地性组织系统；而 OSS-HDFS 则展示了这套接口语义如何被云对象存储重新承接。

HDFS 的核心不是“文件系统”三个字

databricks-what-is-hdfs 对 HDFS 的介绍很基础，但它帮我抓住了 HDFS 的本质：把大文件切成 block，分散到多个 DataNode，通过副本保证故障下仍可读取，再由 NameNode 维护文件系统元数据。

这套设计对应的是一个很具体的时代背景：大量廉价服务器组成集群，硬件失败是常态，数据量大到不能靠单机文件系统解决，批处理引擎又希望把计算尽量放到数据附近。

所以 HDFS 不是为了“像 POSIX 文件系统一样通用”而生的。它更像是为大文件、高吞吐、顺序读写和批处理准备的分布式存储层。理解这一点后，很多限制也就合理了：小文件会伤害 NameNode 元数据，随机低延迟访问不是它的主场，强依赖数据本地性的设计也会在云对象存储时代重新被审视。

NameNode 和 DataNode 的取舍

HDFS 最经典的结构是 NameNode / DataNode 分工。

NameNode 是控制平面：它知道目录树、文件到 block 的映射、block 所在节点和访问权限。DataNode 是数据平面：它真正保存 block，执行读写、复制和删除。

我会把这个架构记成一个取舍：元数据集中管理让系统语义更清楚，数据块分散保存让吞吐和容量可以横向扩展。但代价是元数据管理本身变成关键系统问题，NameNode 的规模、可靠性和小文件压力都会成为平台边界。

OSS-HDFS 是 HDFS 语义的云化承接

aliyun-oss-hdfs-overview 展示的是另一条路径：当组织已经有 Hadoop、Spark、Hive、HBase、Flink、Trino 这些生态作业时，直接把底层存储换成普通对象存储并不总是低成本。很多作业、权限、路径和文件系统假设都围绕 HDFS 接口建立。

OSS-HDFS 的意义就在这里：对上兼容 HDFS 接口，对下使用 OSS 的容量和可靠性，并通过统一元数据管理、分层命名空间、JindoSDK、RootPolicy、ProxyUser、UserGroupsMapping 等能力，把 Hadoop 生态里的文件系统语义尽量接住。

我不会把它理解成“OSS 变成了传统 HDFS”。更准确的说法是：OSS-HDFS 保留了 HDFS 访问模型，底层实现和运维边界则云服务化了。传统 HDFS 的 NameNode / DataNode 机器集群心智，变成了对象存储、托管元数据、多活冗余、缓存和生态 SDK 的组合。

`.dlsdata/` 是不能绕开的内部边界

aliyun-oss-hdfs-notice 给了一个很重要的反面提醒：一旦 Bucket 开通 OSS-HDFS，.dlsdata/ 就不是普通业务目录，而是服务保存 HDFS 数据和辅助数据的内部目录。

这意味着常规 OSS 操作不能随意套用：

不要直接删除、重命名、上传或修改 .dlsdata/ 下的对象；
生命周期规则要排除 .dlsdata/，避免误删或错误转换存储类型；
不要同时启用会破坏删除语义的保留策略或版本控制；
不要把日志、清单、ZIP 解压等功能输出到 .dlsdata/；
不要删除或篡改 OSS-HDFS 依赖的 RAM 角色；
Bucket Policy 的 deny 规则要避免阻断 OSS-HDFS 后台服务。

我会把这件事理解成“云对象存储和文件系统语义的交界面”。对象存储允许你按对象做很多通用操作，但 OSS-HDFS 在这些对象之上维护了更高层的文件系统一致性。绕过这层一致性直接操作底层对象，就是风险来源。

云上数据湖的迁移判断

把这三篇放在一起看，我得到的不是“该不该用 HDFS”的单点结论，而是一条演化线：

HDFS 解决的是本地集群时代的大文件分布式存储、容错和数据本地性；
对象存储解决的是云时代的容量、成本、可靠性和弹性；
OSS-HDFS 试图在二者之间保留 HDFS 接口语义，降低 Hadoop 生态迁移成本；
但这也带来新的运维边界，尤其是 .dlsdata/、生命周期、版本控制、权限和后台服务状态。

所以我以后判断这类方案时，会先问几个问题：

上层计算生态是否强依赖 HDFS API；
是否需要保留 hdfs:// 路径和 Hadoop 权限 / 用户代理语义；
对象存储生命周期、版本控制和安全策略是否会碰到 OSS-HDFS 内部目录；
冷热分层是否由 OSS-HDFS 自己管理，而不是普通 OSS 规则粗暴处理；
缓存和 JindoFuse 是否足以支撑目标查询或计算路径。

对我的提醒

HDFS 和 OSS-HDFS 的关系，很像很多基础设施迁移里的老问题：接口语义可以被保留，但底层实现一旦变化，失败模式和运维边界也会跟着变化。

这也是我最想记住的点。不要只看“兼容 HDFS 接口”这几个字。真正要判断的是：哪些 HDFS 语义被保留了，哪些对象存储能力不能再随便用，哪些后台服务和元数据状态需要被纳入生产运维。

来源：databricks-what-is-hdfs · aliyun-oss-hdfs-overview · aliyun-oss-hdfs-notice

kaikai's wiki

探索

HDFS 与 OSS-HDFS

HDFS 的核心不是“文件系统”三个字

NameNode 和 DataNode 的取舍

OSS-HDFS 是 HDFS 语义的云化承接

`.dlsdata/` 是不能绕开的内部边界

云上数据湖的迁移判断

对我的提醒

关系图谱

目录

反向链接

kaikai's wiki

探索

HDFS 与 OSS-HDFS

HDFS 的核心不是“文件系统”三个字

NameNode 和 DataNode 的取舍

OSS-HDFS 是 HDFS 语义的云化承接

.dlsdata/ 是不能绕开的内部边界

云上数据湖的迁移判断

对我的提醒

关系图谱

目录

反向链接

`.dlsdata/` 是不能绕开的内部边界