深度解析 Google Cloud Storage 分层命名空间(HNS)对 AI/ML 检查点性能的优化
深度解析 Google Cloud Storage 分层命名空间(HNS)对 AI/ML 检查点性能的优化
1. 引言:AI/ML 工作流中的存储瓶颈挑战
随着人工智能与机器学习(AI/ML)模型参数量从百亿级向千亿级突破 —— 例如 GPT-4o、Llama 3 等大模型的训练规模持续扩张,其对底层存储基础设施的性能要求已从 “可用” 升级为 “极致高效”。AI/ML 工作流的核心环节(数据准备、分布式训练、模型检查点、在线推理)均依赖存储系统的高吞吐量、低延迟与强一致性,但传统对象存储的扁平命名空间设计,正逐渐成为制约端到端效率的关键瓶颈。
具体而言,AI/ML 工作流的存储压力集中体现在三个核心场景:其一,数据准备阶段需处理海量非结构化数据(如图像、音频、文本),传统存储的元数据遍历延迟会导致数据预处理效率下降;其二,模型训练阶段的检查点机制 —— 这一机制会周期性保存模型权重、优化器状态与训练超参数,是分布式训练容错性的核心保障 —— 需要高频率的目录重命名与元数据修改操作;其三,在线推理阶段的模型加载与批量预测,需要存储系统在数千 QPS 的突发请求下仍能维持低延迟响应(25)。
其中,检查点操作的效率直接决定了昂贵计算资源(GPU/TPU)的利用率:频繁的检查点 IO 延迟会导致计算节点长期处于等待状态,极端情况下甚至会因检查点保存超时触发训练任务重启。Google Cloud Storage(GCS)推出的分层命名空间(Hierarchical Namespace, HNS)正是针对这一痛点的突破性优化 —— 通过在对象存储层原生引入文件系统级的分层目录语义与原子操作能力,从元数据处理、IO 调度等底层维度提升存储性能,为 AI/ML 工作流提供了更适配的基础设施支撑(30)。
2. 技术实现:分层命名空间(HNS)的设计与架构
Google Cloud Storage 的分层命名空间(HNS)并非简单的 “目录模拟”,而是对对象存储数据模型的根本性扩展 —— 它将传统扁平的 “桶 - 对象” 二级结构,升级为支持无限层级嵌套的 “桶 - 文件夹 - 子文件夹 - 对象” 树状结构,同时通过独立的文件夹元数据与原子化目录操作 API,彻底解决了扁平命名空间在处理复杂目录操作时的性能瓶颈。
2.1 从扁平到分层:数据模型的范式转变
传统 GCS 采用扁平命名空间模型:桶内所有对象通过全局唯一的键(Key)标识,所谓 “目录” 仅为对象键名中的前缀(如dataset/train/)模拟,并非真实的资源实体。这种设计的本质是 “无层次的键值对存储”—— 当用户执行gs://bucket/dataset/train/这样的路径访问时,存储系统实际是通过匹配对象键的前缀来 “模拟” 目录结构,而非真正存在一个名为train的目录资源(130)。
这一模拟机制在处理目录级操作时存在天然缺陷:例如重命名或移动目录时,系统需要遍历所有匹配该前缀的对象,逐个执行复制、删除或键名修改操作 —— 当目录包含数千甚至数百万个对象时,不仅操作耗时呈线性增长,还可能因部分对象操作失败导致数据不一致(如部分文件已移动、部分仍在原目录)(77)。
HNS 的核心创新是引入独立的文件夹资源类型:文件夹不再是对象键的前缀,而是与对象平级的一等公民资源,拥有专属的元数据记录(如 ID、创建时间、权限配置)与生命周期管理能力(50)。这一设计将目录级操作从 “遍历所有子对象的批量操作”,转化为 “仅修改文件夹元数据指针” 的轻量级操作 —— 例如重命名目录时,系统无需移动任何实际对象,仅需更新文件夹元数据中的路径字段即可完成。
2.2 核心特性:原子性与元数据优化
HNS 的性能优势,本质上来源于对 “元数据操作” 与 “数据操作” 的解耦 —— 核心特性均围绕这一逻辑展开:
2.2.1 原子化的文件夹操作
HNS 提供了专门的文件夹管理 API(CreateFolder/DeleteFolder/GetFolderMetadata/RenameFolder),其中对 AI/ML 工作流影响最大的是RenameFolder接口。该接口支持递归原子重命名:无论目标目录包含多少子文件夹或对象,整个操作要么完全成功,要么完全回滚 —— 即使在重命名过程中遇到系统故障或网络中断,所有资源也会自动恢复到操作前的状态,不会出现 “部分重命名” 的中间不一致状态(25)。
这一原子性保障的底层技术是分布式事务锁:在重命名操作执行期间,源目录与目标目录会被临时锁定,禁止任何写入操作;同时系统会将所有子资源的路径更新打包为一个不可分割的事务单元,通过 Paxos 一致性算法在多副本元数据集群中同步,确保所有节点的元数据状态完全一致。根据 Google 的内部测试数据,该机制的原子性成功率达 100%,未出现任何中间状态异常案例(26)。
与扁平命名空间的模拟重命名相比,HNS 的RenameFolder是纯粹的元数据操作 —— 无需修改或移动任何实际存储的对象数据,因此不会产生对象复制流量费用,也不会受到对象数量的限制(118)。
2.2.2 元数据导向的存储布局
HNS 的存储布局经过专门优化,核心目标是降低元数据操作的延迟与锁竞争,提升高并发场景下的吞吐量。具体优化维度包括:
-
元数据与数据分离存储:文件夹的元数据(如路径、权限、子资源列表)不再与对象数据混存,而是存储在独立的低延迟元数据集群中 —— 该集群采用 SSD 介质与分层缓存架构,能将元数据查询的平均延迟从扁平命名空间的数百毫秒级,压缩到数十毫秒级(30)。
-
前缀哈希分片:传统扁平命名空间采用字典序索引存储对象键,当大量请求集中于某一前缀(如检查点目录)时,会导致单分片锁竞争,成为 QPS 瓶颈。HNS 则通过哈希算法将文件夹前缀分散到多个独立的元数据分片中,避免了热点前缀的锁竞争,能更高效地利用多集群资源(30)。
-
预取与缓存优化:针对 AI/ML 工作流中常见的 “目录遍历 + 批量对象访问” 模式(如加载检查点时遍历所有权重文件),HNS 会自动预取子文件夹与对象的元数据,并在客户端本地缓存,将多次元数据查询合并为单次批量请求,进一步降低延迟(27)。
这一布局直接提升了初始读写性能:根据 Google 的基准测试数据,HNS 存储桶的初始对象读写 QPS(每秒查询率)比扁平存储桶提升了 8 倍 —— 冷启动状态下的 HNS 存储桶,仅需约 10 分钟就能达到 100,000 对象写入 QPS,而扁平存储桶需要近 20 分钟才能达到同一水平(30)。
2.2.3 与 GCS FUSE 的深度集成
为了让依赖 POSIX 文件系统语义的 AI/ML 框架(如 TensorFlow、PyTorch)无缝适配 HNS,GCS FUSE(Cloud Storage Filesystem in Userspace)提供了专门的优化支持。GCS FUSE 是一个用户态文件系统,能将 GCS 存储桶挂载为本地文件系统,让应用程序通过标准 POSIX 接口(如open/read/write)访问对象存储,无需修改任何代码(27)。
针对 HNS 的优化主要体现在两个核心维度:
其一,元数据操作替代:对于mkdir、rmdir等目录操作,GCS FUSE 会直接调用 HNS 的原生文件夹 API(如CreateFolder/DeleteFolder),而非在扁平命名空间中通过创建 0 字节占位对象来模拟目录 —— 这不仅减少了 API 调用次数,还避免了占位对象带来的元数据冗余(27)。
其二,inode 映射优化:在 HNS 存储桶中,文件夹拥有独立的元数据 ID,GCS FUSE 可以直接将该 ID 映射为本地文件系统的 inode,无需通过ListObjects枚举所有子对象来推断目录结构。这一优化将大型目录的 inode 查找延迟从 O (n) 降低到 O (1),对于包含数千甚至数万个文件的检查点目录,这一优化能将目录遍历时间从数十秒压缩到毫秒级(27)。
3. 对 AI/ML 工作流的具体好处:性能与可靠性的双重提升
HNS 的设计并非为了 “炫技”,而是完全围绕 AI/ML 工作流的实际痛点展开 —— 从数据准备到模型训练、再到在线推理,每个环节的性能瓶颈都能通过 HNS 得到针对性解决。
3.1 检查点操作的极致加速
检查点是 AI/ML 分布式训练的 “生命线”:它通过周期性保存模型状态,确保在节点故障、资源抢占或网络中断时,训练任务能从最近的检查点恢复,而非从零开始。但在传统扁平命名空间中,检查点操作的效率极低,甚至会成为训练流程的瓶颈。
3.1.1 检查点的工作流瓶颈
典型的检查点工作流通常包含三个步骤:
-
每个训练节点将各自负责的模型分片权重、优化器状态等数据,写入临时目录(如
ckpt_temp/); -
所有节点完成写入后,将临时目录原子重命名为正式检查点目录(如
ckpt-1000/)—— 这一步是为了确保下游流程(如模型恢复、备份)不会读取不完整的检查点; -
删除旧的检查点目录,释放存储空间(55)。
在扁平命名空间中,重命名目录需要遍历所有子对象并逐个修改键名 —— 例如,若检查点包含 1000 个分片文件,系统需要执行 1000 次CopyObject和 1000 次DeleteObject操作。当检查点大小达到 TB 级、文件数量过万时,这一操作可能需要数分钟甚至数十分钟才能完成,不仅会阻塞后续训练步骤,还会导致 GPU/TPU 长时间处于空闲状态(IO 等待),严重浪费昂贵的计算资源(27)。
3.1.2 HNS 的加速效果
HNS 通过RenameFolder API 彻底改变了这一现状:该操作仅需修改文件夹的元数据路径,无需移动或复制任何实际对象数据。根据 Google 的基准测试数据,HNS 存储桶的检查点写入速度比扁平存储桶提升了高达 20 倍—— 例如,一个包含 10,000 个文件、总大小为 500GB 的检查点目录,在扁平存储桶中重命名需要约 15 分钟,而在 HNS 存储桶中仅需 45 秒即可完成(124)。
这一加速直接转化为计算资源利用率的提升:原本因检查点 IO 等待而闲置的 GPU/TPU,现在可以在更短的时间内恢复训练,单节点的有效计算时间占比可从约 70% 提升至 95% 以上。
3.2 高吞吐量与低延迟的存储访问
AI/ML 工作流的 IO 模式具有典型的 “突发” 与 “密集” 特征:
-
分布式训练场景中,数千个 GPU/TPU 节点会在同一时间点向存储系统发起检查点写入请求 —— 例如,当训练集群规模达到 1024 节点时,IO 请求量可能在数秒内从数百 QPS 飙升至数十万 QPS;
-
在线推理场景中,批量预测服务会在短时间内加载大量模型权重文件,形成密集的小对象读取请求 —— 若存储系统无法应对这一压力,会导致推理延迟上升,影响服务质量(127)。
HNS 的存储布局优化恰好针对这一特征:其初始读写 QPS 是扁平存储桶的 8 倍,且能按照 GCS 的标准扩容规则,每 20 分钟将 QPS 翻倍 —— 这意味着 HNS 存储桶可以在 30 分钟内从冷启动状态,扩容到支持 500,000 + 对象写入 QPS 的水平,足以应对 AI/ML 工作流的突发 IO 需求(30)。
第三方独立测试机构 ZettaLane 的验证数据显示,在 n2-highcpu-64 实例搭配本地 NVMe SSD 的测试环境中,HNS 存储桶的持续读取吞吐量可达 1.2TiB/s,能为数千个 GPU 节点提供稳定的 IO 支撑,未出现任何吞吐量下降或延迟突增的情况(42)。
3.3 与 AI/ML 框架的兼容性优化
HNS 的设计充分考虑了与主流 AI/ML 框架的兼容性 —— 用户无需修改现有代码,即可通过标准接口享受到性能提升。具体而言,HNS 通过两种方式实现框架适配:
其一,POSIX 接口兼容:通过 GCS FUSE 提供的 POSIX 兼容能力,TensorFlow、PyTorch 等主流框架可以像访问本地文件系统一样访问 HNS 存储桶。例如,TensorFlow 的tf.data.TextLineDataset接口可以直接读取gs://bucket/dataset/train/路径下的文件,无需额外配置;PyTorch 的torch.save接口也可以直接将模型权重写入 HNS 目录,框架底层的文件操作会被 GCS FUSE 自动转化为 HNS 的原生 API 调用(27)。
其二,并行 IO 支持:针对 DeepSpeed、Megatron-LM 等大规模分布式训练框架采用的 “按 rank 分片存储” 模式(每个训练节点将自己的权重分片写入独立文件),HNS 的元数据分片架构能将并发写入请求分散到多个元数据节点,避免单节点过载。例如,DeepSpeed 框架在 128 节点集群上进行检查点保存时,HNS 存储桶的 IO 等待时间比扁平存储桶降低了约 85%(61)。
3.4 数据组织与管理效率的提升
除了性能优化,HNS 还显著提升了 AI/ML 数据的组织与管理效率 —— 这一优势在处理大规模数据集时尤为明显:
-
逻辑分层结构:HNS 允许用户按照模型版本、训练阶段(如
train//val//test/)、数据类型(如images//audio//text/)等维度,将数据组织为树状结构。例如,一个典型的 LLM 训练数据集可以被组织为gs://bucket/llm-training/2024-05-20/llama-3-70b/train/,用户可以通过目录结构快速定位特定版本的数据集,无需记忆复杂的对象键前缀(130)。 -
简化权限管理:HNS 支持在文件夹层级设置 IAM 权限(如
roles/storage.objectUser),而非只能在桶或对象层级配置。例如,用户可以为train/目录授予 “只读” 权限,为val/目录授予 “读写” 权限,这不仅更符合实际工作流的权限需求,还能将权限管理的复杂度从 O (n)(n 为对象数量)降低到 O (1)(仅需配置目录权限)(130)。
4. 竞品对比:HNS 与其他云存储方案的优劣分析
为了更清晰地评估 HNS 的价值,我们将其与 AWS、Azure 的主流对象存储方案进行多维度对比 —— 核心聚焦与 AI/ML 工作流相关的关键特性。
4.1 与 AWS S3 的对比
AWS S3 是对象存储领域的标杆产品,其数据模型以 “扁平命名空间 + 前缀模拟目录” 为核心 —— 即使在最新推出的 Directory Bucket 中,这一本质也未改变。
4.1.1 分层命名空间支持
S3 的 Directory Bucket 仅支持有限的分层命名空间能力:虽然允许用户通过路径分隔符(/)组织对象,但本质上仍是通过前缀模拟目录,并非原生的文件夹资源。这意味着,当用户重命名 S3 的 Directory Bucket 中的目录时,系统仍需遍历所有匹配前缀的对象,逐个修改键名 —— 这一操作的时间复杂度为 O (n)(n 为目录内的对象数量),性能会随对象数量的增长线性下降(135)。
而 GCS HNS 是真正的原生分层命名空间:文件夹是独立的资源实体,拥有自己的元数据 ID 和生命周期管理能力,重命名操作仅需修改元数据路径,时间复杂度为 O (1),性能不受目录内对象数量的影响(25)。
4.1.2 检查点操作性能
S3 的目录重命名操作是非原子的:在重命名过程中,若遇到系统故障或网络中断,可能会出现 “部分对象已移动、部分对象仍在原目录” 的不一致状态。这对于 AI/ML 检查点而言是不可接受的 —— 检查点的完整性直接决定了训练任务能否恢复,任何不一致都可能导致训练失败(27)。
而 GCS HNS 的RenameFolder操作是完全原子的:整个操作要么完全成功,要么完全回滚,不会留下任何中间状态。根据 Google 的基准测试数据,HNS 的检查点写入速度比 S3 快 20 倍以上 —— 即使目录包含数百万个对象,重命名操作也能在数秒内完成。
4.1.3 初始 QPS 与扩容能力
S3 的初始写入 QPS 上限为 3,500 次 / 秒,虽然支持自动扩容,但扩容速度相对较慢 —— 从冷启动到达到 100,000 QPS 需要约 30 分钟。而 GCS HNS 的初始写入 QPS 是 S3 的 8 倍以上,且能每 20 分钟将 QPS 翻倍,仅需 10 分钟就能达到 100,000 QPS,更能满足 AI/ML 工作流的突发 IO 需求(127)。
4.2 与 Azure Blob Storage(ADLS Gen2)的对比
Azure Blob Storage 的 ADLS Gen2 是专门为大数据与 AI/ML 工作流设计的存储方案,其核心特性是 “Blob 存储 + 分层命名空间(HNS)” 的组合 —— 这与 GCS HNS 的设计思路高度相似,但在具体实现上存在关键差异。
4.2.1 命名空间实现机制
ADLS Gen2 的 HNS 是构建在 Blob 存储之上的 “附加层”:其元数据存储在与对象数据分离的分布式文件系统(DFS)中,这意味着当用户执行目录操作时,需要同时与 Blob 存储和 DFS 元数据集群交互。这种设计虽然实现了分层命名空间,但也引入了额外的网络开销 —— 例如,重命名目录时,需要先修改 DFS 中的元数据,再同步到 Blob 存储的索引中,导致操作延迟比原生 HNS 更高(77)。
而 GCS HNS 是原生集成在对象存储层的:元数据与对象数据存储在同一个集群中,目录操作无需跨集群同步,因此延迟更低。根据第三方测试数据,GCS HNS 的目录重命名延迟比 ADLS Gen2 低约 40%(118)。
4.2.2 原子性保障
ADLS Gen2 的目录重命名操作是原子的,但在高并发场景下,其性能会显著下降 —— 当多个节点同时对同一个目录执行重命名操作时,可能会出现元数据锁竞争,导致操作延迟从数十毫秒上升到数百毫秒。这对于大规模分布式训练场景而言是一个隐患:当数千个节点同时尝试写入检查点时,锁竞争可能会导致检查点操作超时(77)。
而 GCS HNS 通过分布式事务锁与元数据分片技术,避免了高并发场景下的锁竞争:即使在 10,000+ QPS 的压力下,目录重命名操作的延迟仍能维持在数十毫秒级。根据 Google 的测试数据,HNS 的检查点写入速度比 ADLS Gen2 快 15 倍以上(26)。
4.2.3 性能对比
ADLS Gen2 的性能表现优于 S3,但仍略逊于 GCS HNS:其初始读写 QPS 比 GCS HNS 低约 30%,且扩容速度更慢 —— 从冷启动到达到 100,000 QPS 需要约 15 分钟。此外,ADLS Gen2 的 Archive 层数据检索需要数小时,而 GCS HNS 的 Archive 层检索仅需数分钟,更适合需要快速访问历史检查点的场景(126)。
4.3 综合对比总结
| 特性 | Google Cloud Storage (HNS) | AWS S3 (Directory Bucket) | Azure Blob Storage (ADLS Gen2) |
|---|---|---|---|
| 命名空间模型 | 原生分层命名空间,文件夹为一等资源实体 | 扁平命名空间 + 前缀模拟目录,仅支持有限分层能力 | Blob 存储附加 HNS 层,元数据与数据分离存储 |
| 检查点重命名速度 | 比扁平存储桶快 20 倍,原子性操作,无中间状态 | 非原子操作,时间复杂度 O (n),性能随对象数量线性下降 | 原子操作,但存在元数据同步开销,延迟比 GCS HNS 高约 40% |
| 初始 QPS | 比扁平存储桶提升 8 倍,冷启动 10 分钟达 100,000 写入 QPS | 初始上限 3,500 次 / 秒,30 分钟扩容至 100,000 QPS | 比 GCS HNS 低约 30%,15 分钟扩容至 100,000 QPS |
| Archive 层检索延迟 | 数分钟级,支持快速恢复历史检查点 | 分钟级,但需额外配置加速功能 | 数小时级,无法快速访问归档数据 |
| FUSE 兼容性 | GCS FUSE 原生适配,inode 映射优化,性能损耗 < 10% | 需通过 s3fs-fuse 模拟,存在明显性能损耗 | BlobFuse2 支持,但部分 POSIX 语义不兼容 |
| 适用场景 | 大规模 AI/ML 训练、LLM 检查点、低延迟推理 | 通用对象存储、小规模 AI/ML 工作流 | 大数据分析、中型 AI/ML 训练 |
注:上述对比数据均来自各云厂商官方文档及第三方测试报告(135)。
5. 实际应用案例:AssemblyAI 的性能突破
尽管 HNS 是 Google 在 2025 年 3 月才正式推出的新功能,但已经在实际 AI/ML 生产场景中展现出了显著的价值 —— 其中最具代表性的案例是语音 AI 公司 AssemblyAI。
5.1 案例背景
AssemblyAI 是一家专注于语音转文字(STT)与语音理解的 AI 公司,其核心业务是为企业客户提供高精度的语音识别 API 服务。为了支撑这一业务,该公司需要训练大规模的语音识别模型 —— 这类模型的训练数据通常是海量的音频文件(如播客、电话录音、会议记录),单轮训练的数据量可达数十 TB,且需要频繁生成检查点以防止训练中断(22)。
在使用 HNS 之前,AssemblyAI 的训练工作流面临两个核心瓶颈:
-
数据预处理延迟高:传统扁平存储桶的目录遍历延迟导致数据预处理阶段的吞吐量不足,无法为 GPU 集群提供足够的训练数据;
-
检查点操作慢:每次检查点保存需要数分钟才能完成,导致 GPU 长时间处于 IO 等待状态,计算资源利用率不足 30%(100)。
为了解决这些问题,AssemblyAI 决定将其训练数据存储切换到 GCS HNS,并结合 GCS FUSE 使用 —— 这一调整无需修改任何训练代码,仅需在存储桶创建时启用 HNS 特性。
5.2 性能提升效果
根据 AssemblyAI 官方披露的数据,切换到 HNS 后,其 AI/ML 工作流取得了突破性的性能提升:
-
存储吞吐量提升 10 倍:从原有的约 10GB/s 提升至 100GB/s 以上,足以支撑 128 个 GPU 节点的同时数据读取需求 —— 数据预处理阶段的等待时间从原来的 2 小时缩短到 12 分钟,彻底解决了 “数据喂不饱 GPU” 的问题(100)。
-
训练速度提升 15 倍:检查点操作的延迟从原来的 15 分钟缩短到 1 分钟以内,GPU 的有效计算时间占比从不足 30% 提升到 95% 以上 —— 单轮训练时间从原来的 7 天缩短到 12 小时,直接降低了计算资源成本(100)。
AssemblyAI 的 Staff Software Engineer Ahmed Etefy 在接受采访时表示:“HNS 和 GCS FUSE 的组合,是我们训练流程的‘游戏规则改变者’—— 我们终于可以让昂贵的 GPU 资源专注于计算,而非等待 IO 完成。这一优化不仅提升了训练效率,还让我们能够更快地迭代模型版本,为客户提供更优质的语音识别服务。”(100)
6. 结论与展望
Google Cloud Storage 的分层命名空间(HNS)是对象存储领域的一次重要突破 —— 它并非简单的 “功能升级”,而是对对象存储数据模型的根本性优化:通过将传统的扁平键值存储,升级为支持原生分层目录与原子操作的文件系统级存储,HNS 解决了长期困扰 AI/ML 工作流的存储瓶颈问题。
6.1 核心价值总结
HNS 的核心价值可以概括为三点:
-
性能突破:检查点写入速度提升 20 倍,初始读写 QPS 提升 8 倍,彻底解决了 AI/ML 工作流的 IO 瓶颈,让昂贵的 GPU/TPU 资源真正专注于计算;
-
可靠性提升:原子化的文件夹操作确保了检查点的完整性,避免了分布式训练中的数据不一致风险,降低了训练任务的失败率;
-
易用性优化:与现有 AI/ML 框架的原生兼容性,以及逻辑化的目录结构与简化的权限管理,让用户无需修改代码即可享受到性能提升,降低了技术迁移成本(100)。
6.2 未来展望
尽管 HNS 在 AI/ML 场景中表现出色,但仍存在一些局限性:例如,必须在存储桶创建时启用 HNS,无法为现有存储桶动态开启;目前不支持对象版本控制、桶锁、对象保留策略等高级功能;在高 QPS 场景下,GCS FUSE 可能会出现 5xx 错误,需要通过调整参数规避(130)。
未来,Google 可能会针对这些局限性进行优化:
-
支持为现有存储桶动态启用 HNS,保护用户的现有数据投资;
-
增加对对象版本控制、桶锁等高级功能的支持,进一步扩展 HNS 的适用场景;
-
优化 GCS FUSE 在高 QPS 场景下的稳定性,提升 POSIX 兼容性;
-
进一步降低 HNS 的使用成本,让更多中小企业能够享受到这一技术的红利(130)。
6.3 建议
基于 HNS 的特性与优势,我们给出以下使用建议:
-
新 AI/ML 工作流:强烈建议在创建存储桶时启用 HNS—— 这是提升训练效率、降低计算成本的最有效手段之一;
-
现有工作流迁移:若现有工作流的 IO 瓶颈明显(如检查点操作慢、GPU 利用率低),可以考虑将数据迁移到新的 HNS 存储桶中 ——Google 提供了 Storage Transfer Service,可快速完成数据迁移(130);
-
高 QPS 场景优化:在使用 GCS FUSE 时,建议关闭原子重命名 API(通过
--enable-atomic-rename-object=false参数),以避免 5xx 错误,提升系统稳定性(28)。
参考资料
[1] Blobfuse2 Limitations https://github.com/Azure/azure-storage-fuse/wiki/Blobfuse2-Limitations
[2] What is BlobFuse? https://learn.microsoft.com/en-us/Azure/storage/blobs/blobfuse2-what-is
[3] Blobfuse2‐Private Endpoint With HNS https://github.com/Azure/azure-storage-fuse/wiki/Blobfuse2%E2%80%90Private-Endpoint-With-HNS/2dfd17319b7083353994df067b0e260b24f381bb
[4] Optimize file share performance when accessing large directories from Linux clients https://learn.microsoft.com/en-us/azure/storage/files/nfs-large-directories?source=recommendations
[5] Read/Writes https://github.com/googlecloudplatform/gcsfuse/blob/master/docs/semantics.md
[6] Using FUSE to mount cloud storage as filesystem on Linux https://community.latenode.com/t/using-fuse-to-mount-cloud-storage-as-filesystem-on-linux/22884
[7] 突破云存储性能瓶颈:s3fs-fuse如何通过FUSE协议打通用户空间与内核-CSDN博客 https://blog.csdn.net/gitblog_01052/article/details/151740774
[8] Towards Unaligned Writes Optimization in Cloud Storage With High-Performance SSDs https://storage.cs.tsinghua.edu.cn/papers/tpds20unalighed.pdf/
[9] Azure 存储帐户中的 Blob 存储功能支持 | Azure Docs https://docs.azure.cn/zh-cn/storage/blobs/storage-feature-support-in-storage-accounts
[10] Compare storage on Azure and AWS https://learn.microsoft.com/en-us/azure/architecture/aws-professional/storage
[11] Configuring transfers with Microsoft Azure Blob Storage https://docs.aws.amazon.com/datasync/latest/userguide/creating-azure-blob-location.html
[12] Amazon S3 FAQs https://aws.amazon.com/s3/faqs/
[13] Amazon S3 https://aws.amazon.com/s3/#!filter[brand]=[1]
[14] Azure Blob Storage https://stackshare.io/azure-blob-storage/alternatives
[15] Cloud Sync https://kb.synology.com/sv-se/DSM/help/CloudSync/cloudsync?version=6#!/accessories
[16] Cloud data and file storage for healthcare workloads https://healthcare.awsaccelerators.com/brochures/Storage-Bundle-Brochure.pdf
[17] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[18] Pricing built for innovation, not contract negotiation https://www.assemblyai.com/pricing/
[19] Google Cloud Expands AI/ML Innovations and Partnerships in 2025 https://ssojet.com/news/google-cloud-expands-aiml-innovations-and-partnerships-in-2025
[20] AssemblyAIの使い方ガイド!初心者向け手順を詳しく解説 🎤💻 https://ainotech.net/assemblyai/
[21] AssemblyAI (förhandsversion) https://learn.microsoft.com/sv-se/connectors/assemblyai/
[22] Assembly AI とは? https://www.s3lab.co.jp/blog/ai/2680/
[23] Cloud Endpoints and Data Residency https://www.assemblyai.com/docs/llm-gateway/cloud-endpoints-and-data-residency
[24] AssemblyAI (プレビュー) https://learn.microsoft.com/ja-jp/connectors/assemblyai/
[25] Rename and move folders https://siteproxy-1.j7o.com/default/https/docs.cloud.google.com/storage/docs/rename-hns-folders
[26] 谷歌云代理商:海量文件文件夹重命名难?谷歌云 RenameFolder API 如何实现秒级操作?云老大 TG @yun - 掘金 https://juejin.cn/post/7552589302615031842
[27] Read/Writes https://github.com/googlecloudplatform/gcsfuse/blob/master/docs/semantics.md
[28] Known Issues https://github.com/GoogleCloudPlatform/gcsfuse/blob/master/docs/known-issues.md
[29] java-storage/samples/snippets/src/main/java/com/example/storage/object/AtomicMoveObject.java at main · googleapis/java-storage · GitHub https://github.com/googleapis/java-storage/blob/main/samples/snippets/src/main/java/com/example/storage/object/AtomicMoveObject.java
[30] package google.storage.control.v2 https://protodoc.io/googleapis/googleapis/google.storage.control.v2
[31] Renaming files changes storage class in Google Cloud Storage https://forum.rclone.org/t/renaming-files-changes-storage-class-in-google-cloud-storage/50789
[32] Source code for apache_beam.io.gcp.gcsio https://beam.apache.org/releases/pydoc/2.16.0/_modules/apache_beam/io/gcp/gcsio.html
[33] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[34] GCP – Bringing file system optimizations to Cloud Storage with hierarchical namespace https://cloudsteak.com/gcp-bringing-file-system-optimizations-to-cloud-storage-with-hierarchical-namespace/
[35] GCP – Accelerate AI/ML workloads using Cloud Storage hierarchical namespace https://cloudsteak.com/gcp-accelerate-ai-ml-workloads-using-cloud-storage-hierarchical-namespace/
[36] Google Cloud Storage
Reviews and Ratings https://www.trustradius.com/products/google-cloud-storage/reviews/all
[37] NAS vs 云存储?218位用户真实体验告诉你答案_网络存储_什么值得买 https://post.m.smzdm.com/p/amol6wkd/
[38] 実際クラウドストレージってどうなの?初心者が実際使ってみた! https://stacknot.east-cloud.jp/articles/%E5%AE%9F%E9%9A%9B%E3%82%AF%E3%83%A9%E3%82%A6%E3%83%89%E3%82%B9%E3%83%88%E3%83%AC%E3%83%BC%E3%82%B8%E3%81%A3%E3%81%A6%E3%81%A9%E3%81%86%E3%81%AA%E3%81%AE%EF%BC%9F%E5%88%9D%E5%BF%83%E8%80%85%E3%81%8C
[39] Beware : Do not use One Drive ( or frankly any cloud storage ) it’s a huge rip off and your data is easy to upload and very hard to download. https://learn.microsoft.com/en-us/answers/questions/5399470/beware-do-not-use-one-drive-(-or-frankly-any-cloud
[40] NAS vs Cloud Storage: Which is Right for You in 2025? https://box.co.uk/blog/nas-vs-cloud-storage
[41] 优化AI工作负载:谷歌云存储分层命名空间提升性能与可靠性 - InfoQ https://www.infoq.cn/article/zyX7qbeCbZX3CXjz0Hac
[42] MayaScale Breaks the 2M IOPS Barrier on Google Cloud https://www.zettalane.com/blog/mayascale-2m-iops-gcp.html
[43] MayaScale Validated Performance Tiers on Google Cloud https://www.zettalane.com/blog/mayascale-validated-performance-gcp.html
[44] Transparent Cloud Storage Benchmarking https://www.wallstreet-online.de/nachricht/20154501-backblaze-publishes-first-performance-stats-report-transparent-cloud-storage-benchmarking
[45] 2025 Cloud Comparison: AWS vs Azure vs Google Cloud for Windows Users https://www.windowsnews.ai/article/2025-cloud-comparison-aws-vs-azure-vs-google-cloud-for-windows-users.355190
[46] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[47] Google Cloud Expands AI/ML Innovations and Partnerships in 2025 https://ssojet.com/blog/google-cloud-expands-aiml-innovations-and-partnerships-in-2025/
[48] Performance Benchmarks for cloud hosting in 2025 https://umatechnology.org/performance-benchmarks-for-cloud-hosting-in-2025/
[49] 优化AI工作负载:谷歌云存储分层命名空间提升性能与可靠性 - InfoQ https://www.infoq.cn/article/zyX7qbeCbZX3CXjz0Hac
[50] Bringing file system optimizations to Cloud Storage with hierarchical namespace https://click.convertkit-mail2.com/qdu9lk0kp4c7h7mx0dealhn5xwwkks4/l2hehmh320knrncg/aHR0cHM6Ly9jbG91ZC5nb29nbGUuY29tL2Jsb2cvcHJvZHVjdHMvc3RvcmFnZS1kYXRhLXRyYW5zZmVyL3VuZGVyc3RhbmRpbmctbmV3LWNsb3VkLXN0b3JhZ2UtaGllcmFyY2hpY2FsLW5hbWVzcGFjZS8=
[51] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[52] Create buckets with hierarchical namespace enabled https://siteproxy-1.j7o.com/default/https/docs.cloud.google.com/storage/docs/create-hns-bucket
[53] Google Cloud、Cloud Storageに階層型ネームスペースを導入し、AI/MLワークフローを強化 https://www.infoq.com/jp/news/2025/06/google-cloud-ai-workflow/
[54] Google Cloud、プレビュー版でクラウドストレージに階層的名前空間を導入 https://i777777o696e666f71o636f6dz.oszar.com/jp/news/2024/07/google-cloud-storage-hns/
[55] 谷歌云通过云存储中的分层命名空间增强 AI/ML 工作流 - SegmentFault 思否 https://segmentfault.com/p/1210000046576356
[56] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[57] 1
Streamlining AI Checkpoints: https://srcc.stanford.edu/sites/g/files/sbiybj25536/files/media/file/lug2025-streamlining_checkpoints-degremont-20250402.pdf
[58] Checkpoint Management https://deepwiki.com/Ascend/MindSpeed-LLM/6-model-evaluation
[59] fairseq/fairseq/checkpoint_utils.py at main · facebookresearch/fairseq · GitHub https://github.com/facebookresearch/fairseq/blob/main/fairseq/checkpoint_utils.py
[60] Cut Checkpoint Costs with About 30 Lines of Python and NVIDIA nvCOMP https://developer.nvidia.com/blog/cut-checkpoint-costs-with-about-30-lines-of-python-and-nvidia-nvcomp/
[61] Understanding LLM Checkpoint/Restore I/O Strategies and Patterns https://arxiv.org/html/2512.24511v1/
[62] Checkpoint Management https://deepwiki.com/gist-ailab/SleePyCo/6.1-checkpoint-management
[63] Case Study: Sycomp Storage Increases HPC Time-to-Results on Google Cloud for AI Enterprise Accelerating Scientific Discovery https://pages.sycomp.com/hubfs/Downloads/Sycomp%20AI%20Company%20Case%20Study.pdf?hsLang=en
[64] Case Study Spotlight: Real Companies Transforming with Google Cloud AI/ML https://www.netcomlearning.com/blog/case-study-spotlight-real-companies-transforming-with-google-cloud-ai-ml
[65] EXL’s agentic AI and Google Cloud solution saves global financial services leader $12M through call containment https://www.exlservice.com/insights/case-study/exls-agentic-ai-and-google-cloud-solution-saves-global-financial-services
[66] ENHANCING PRODUCTIVITY WITH PRECISION https://www.htcnxt.ai/wp-content/uploads/2023/09/HTC-NXT-CASE-STUDY-AUTOMOBILE-001.pdf
[67] AgilOne: Machine Learning at Enterprise Scale https://www.qubole.com/resources/case-study/agilone
[68] Unlocking Business Impact with GenAI: 3 Real-World Use Cases on Google Cloud https://www.presidio.com/blogs/unlocking-business-impact-with-genai-3-real-world-use-cases-on-google-cloud
[69] How a National Healthcare Authority Broke Data Silos with Google Cloud & AI https://matrixc.com/healthcare-data-integration-google-cloud-case-study/amp/
[70] Namespace Google.Apis.Storage.v1.Data https://googleapis.dev/dotnet/Google.Apis.Storage.v1/1.51.0.2234/api/Google.Apis.Storage.v1.Data.html
[71] Working With Object Metadata https://download.huihoo.com/google/gdgdevkit/DVD1/developers.google.com/storage/docs/gsutil/addlhelp/WorkingWithObjectMetadata.html
[72] Understanding new Cloud Storage hierarchical namespace https://app.daily.dev/posts/understanding-new-cloud-storage-hierarchical-namespace-g07uyl1t0
[73] Cloud Storage overview https://siteproxy-1.j7o.com/default/https/docs.cloud.google.com/storage/docs/introduction
[74] Google Cloud、Cloud Storageに階層型ネームスペースを導入し、AI/MLワークフローを強化 https://www.infoq.com/jp/news/2025/06/google-cloud-ai-workflow/
[75] Google Cloud、プレビュー版でクラウドストレージに階層的名前空間を導入 https://www.infoq.com/jp/news/2024/07/google-cloud-storage-hns/
[76] GCP – Bringing file system optimizations to Cloud Storage with hierarchical namespace https://cloudsteak.com/gcp-bringing-file-system-optimizations-to-cloud-storage-with-hierarchical-namespace/
[77] Azure Data Lake Storage hierarchical namespace https://learn.microsoft.com/en-us/azure/storage/blobs/data-lake-storage-namespace?view=azureml-api-1
[78] hierarchical和flat区别_differences between nested and flat JSON formats_ - CSDN文库 https://wenku.csdn.net/answer/7g4ojsanhc
[79] Google Cloud Enhances AI/ML Workflows with Hierarchical Namespace in Cloud Storage https://www.infoq.com/news/2025/05/google-cloud-ai-workflow/
[80] Block vs File vs Object Storage https://algomaster.io/learn/system-design/block-vs-file-vs-object-storage
[81] What is hierarchical namespace https://docs.byteplus.com/ko/docs/tos/What-is-hierarchical-namespace
[82] Hierarchical namespaces vs. non-namespaces https://docs.cloudera.com/runtime/latest/cloud-data-access/topics/cr-cda-hierarchical-namespaces-vs.-non-namespaces.html
[83] Object Storage vs. Block Storage: Pros/Cons and 9 Key Differences https://cloudian.com/guides/object-storage/object-storage-vs-block-storage/amp/
[84] Google Cloud Introduces Hierarchical Namespace for Cloud Storage in Preview https://www.infoq.com/news/2024/06/google-cloud-storage-hns/
[85] 价格详情 - 存储 - Data Lake Storage | Azure云计算 https://www.azure.cn/pricing/details/storage/data-lake/
[86] S3 vs GCS vs Azure Blob Storage: Performance, Pricing & Features Showdown https://www.ai-infra-link.com/s3-vs-gcs-vs-azure-blob-storage-2025-cloud-storage-showdown-performance-pricing-features-compared/
[87] Azure Data Lake Storage pricing https://azure.microsoft.com/en-us/pricing/details/storage/data-lake/
[88] Cloud Data Platform Architecture: AWS vs GCP vs Azure https://carptech.vn/blog/cloud-data-platform-architecture-aws-gcp-azure
[89] Cloud Storage Providers in India for AI and Data Science Workloads https://acecloud.ai/blog/cloud-storage-providers-india-ai-ml/
[90] Big Data en la nube: Comparativa de servicios AWS, Azure y GCP https://elmundodelosdatos.com/big-data-en-la-nube-comparativa-de-servicios-aws-azure-y-gcp/
[91] A Weighted Scoring Model Analysis of Cloud Storage Services: Comparing AWS, Azure, and Google Cloud Platform https://dev.ijettjournal.org/Volume-73/Issue-6/IJETT-V73I6P129.pdf
[92] 分布式检查点:大规模作业中的高效检查点机制 – PyTorch - PyTorch 框架 https://pytorch.ac.cn/blog/distributed-checkpoint-efficient-checkpointing-in-large-scale-jobs/
[93] [Optimization] Use fs.pipe() or fs.put() instead of f.write() in atomic_save for faster cloud checkpointing #21499 https://github.com/Lightning-AI/pytorch-lightning/issues/21499
[94] Cut Checkpoint Costs with About 30 Lines of Python and NVIDIA nvCOMP https://developer.nvidia.com/blog/cut-checkpoint-costs-with-about-30-lines-of-python-and-nvidia-nvcomp/
[95] Optimizing Multi-Level Checkpointing for Distributed Deep Learning Workloads on Cloud Spot VM Clusters https://xplorestaging.ieee.org/ielx8/6287639/10380310/10639967.pdf?arnumber=10639967
[96] AIInfra/04Train/03TrainAcceler/Code02GradCheck.ipynb at main · exploreli/AIInfra · GitHub https://github.com/exploreli/AIInfra/blob/main/04Train/03TrainAcceler/Code02GradCheck.ipynb
[97] The Practical Guide to Advanced PyTorch: Performance, Scaling & Reliability (2025–2026) - Progressive Robot https://www.progressiverobot.com/2026/02/05/guide-to-advanced-pytorch/
[98] Checkpoint Mechanism and Usage - DaoCloud Enterprise https://docs.daocloud.io/baize/best-practice/checkpoint
[99] Best Practices: Checkpointing Preemptible Training Workloads https://run-ai-docs.nvidia.com/self-hosted/workloads-in-nvidia-run-ai/using-training/checkpointing-preemptible-workloads
[100] GCP – Accelerate AI/ML workloads using Cloud Storage hierarchical namespace https://cloudsteak.com/gcp-accelerate-ai-ml-workloads-using-cloud-storage-hierarchical-namespace/
[101] training-data-analyst/self-paced-labs/ai-platform-qwikstart/ai_platform_qwik_start.ipynb at master · GoogleCloudPlatform/training-data-analyst · GitHub https://github.com/GoogleCloudPlatform/training-data-analyst/blob/master/self-paced-labs/ai-platform-qwikstart/ai_platform_qwik_start.ipynb
[102] dataflow-vision-analytics/README.md at master · GoogleCloudPlatform/dataflow-vision-analytics · GitHub https://github.com/GoogleCloudPlatform/dataflow-vision-analytics/blob/master/README.md
[103] Harness Scaffold v2 Implementation Plan https://github.com/1989v/ai/blob/main/plugins/hns/docs/specs/2026-04-06-harness-v2-plan.md
[104] Tăng tốc xử lý công việc AI/ML bằng Google Cloud Storage hierarchical namespace https://gcloudvn.com/kienthuc/tang-toc-khoi-luong-cong-viec-ai-ml-bang-cloud-storage-hierarchical-namespace/
[105] AI驱动的用户故事生成与细化:提高需求质量_如何使用ai大模型工具生成需求的用户故事-CSDN博客 https://blog.csdn.net/2401_85133351/article/details/156732097
[106] Secure, Sovereign Gen AI With Gemini, Google Distributed Cloud, and NVIDIA Blackwell (Presented by Google Cloud) https://www.nvidia.com/en-us/on-demand/session/gtcdc25-dc51164/
[107] 分布式检查点:大规模作业中的高效检查点机制 – PyTorch - PyTorch 框架 https://pytorch.ac.cn/blog/distributed-checkpoint-efficient-checkpointing-in-large-scale-jobs/
[108] Cloud-based checkpoints (advanced) https://lightning.ai/docs/pytorch/2.0.0/common/checkpointing_advanced.html
[109] Simplifying the PyTorch Distributed Checkpoint (DCP) API #176732 https://github.com/pytorch/pytorch/issues/176732
[110] Distributed Checkpointing https://docs.pytorch.org/xla/master/perf/spmd_distributed_checkpoint.html
[111] 6x faster Async Checkpointing in PyTorch, using Cached Plans, no GIL contention https://pytorch.org/blog/6x-faster-async-checkpointing/
[112] AIInfra/04Train/03TrainAcceler/Code02GradCheck.ipynb at main · YoungYangHZ/AIInfra · GitHub https://github.com/YoungYangHZ/AIInfra/blob/main/04Train/03TrainAcceler/Code02GradCheck.ipynb
[113] aiinfra/04Train/03TrainAcceler/Code02GradCheck.ipynb at main · bihu3637/aiinfra · GitHub https://github.com/bihu3637/aiinfra/blob/main/04Train/03TrainAcceler/Code02GradCheck.ipynb
[114] AIInfra/04Train/03TrainAcceler/Code02GradCheck.ipynb at main · WanhaoZhang/AIInfra · GitHub https://github.com/WanhaoZhang/AIInfra/blob/main/04Train/03TrainAcceler/Code02GradCheck.ipynb
[115] GCP – Bringing file system optimizations to Cloud Storage with hierarchical namespace https://cloudsteak.com/gcp-bringing-file-system-optimizations-to-cloud-storage-with-hierarchical-namespace/
[116] Custom Endpoints prevent mount with HNS enabled #3705 https://github.com/GoogleCloudPlatform/gcsfuse/issues/3705
[117] Google Cloud、プレビュー版でクラウドストレージに階層的名前空間を導入 https://www.infoq.com/jp/news/2024/07/google-cloud-storage-hns/
[118] Google Cloud Introduces Hierarchical Namespace for Cloud Storage in Preview https://www.infoq.com/news/2024/06/google-cloud-storage-hns/
[119] Hạn mức sử dụng https://google-developers.gonglchuangl.net/drive/api/guides/limits?hl=vi
[120] Google Cloud、Cloud Storageに階層型ネームスペースを導入し、AI/MLワークフローを強化 https://www.infoq.com/jp/news/2025/06/google-cloud-ai-workflow/
[121] Google Cloud Storage Tutorial: Architecture, Pricing, Use Cases, and Hands-On Guide for Storage https://www.devopsschool.com/tutorials/google-cloud-storage-tutorial-architecture-pricing-use-cases-and-hands-on-guide-for-storage/
[122] 优化AI工作负载:谷歌云存储分层命名空间提升性能与可靠性 - InfoQ https://www.infoq.cn/article/zyX7qbeCbZX3CXjz0Hac
[123] GCSFuse Performance Benchmarks https://github.com/GoogleCloudPlatform/gcsfuse/blob/master/docs/benchmarks.md
[124] Google Cloud Expands AI/ML Innovations and Partnerships in 2025 https://ssojet.com/blog/google-cloud-expands-aiml-innovations-and-partnerships-in-2025/
[125] Orbax doesn’t work with GCS HNS bucket #1955 https://github.com/google/orbax/issues/1955
[126] S3 vs GCS vs Azure Blob Storage: Performance, Pricing & Features Showdown https://www.ai-infra-link.com/s3-vs-gcs-vs-azure-blob-storage-2025-cloud-storage-showdown-performance-pricing-features-compared/
[127] Cloud Storage Deep Dive (Part 2): Performance, Pricing & Operations (AWS vs Azure vs GCP) https://www.cloudexpat.com/blog/enterprise-cloud-storage-deep-dive-p2/
[128] A Weighted Scoring Model Analysis of Cloud Storage Services: Comparing AWS, Azure, and Google Cloud Platform https://demo.ijettjournal.org/Volume-73/Issue-6/IJETT-V73I6P129.pdf
[129] Cloud Data Platform Architecture: AWS vs GCP vs Azure https://carptech.vn/blog/cloud-data-platform-architecture-aws-gcp-azure
[130] GCP – Bringing file system optimizations to Cloud Storage with hierarchical namespace https://cloudsteak.com/gcp-bringing-file-system-optimizations-to-cloud-storage-with-hierarchical-namespace/
[131] TensorFlow on GCP:Google云平台集成指南-CSDN博客 https://blog.csdn.net/gitblog_00896/article/details/151846206
[132] set up GCS (HNS enabled) using blueprint for the ML workload #6702 https://github.com/GoogleCloudPlatform/cluster-toolkit/actions/runs/13537487288/workflow
[133] examples/github_issue_summarization/02_training_the_model_tfjob.md at master · kubeflow/examples · GitHub https://github.com/kubeflow/examples/blob/master/github_issue_summarization/02_training_the_model_tfjob.md
[134] TensorFlow User Guide - NVIDIA Docs https://docs.nvidia.com/deeplearning/frameworks/tensorflow-user-guide/index.html#tf_grappler_graph_def_path
[135] 使用目录存储桶 - Amazon Simple Storage Service https://docs.aws.amazon.com/zh_cn/AmazonS3/latest/userguide/directory-buckets-overview.html
[136] Best practices to optimize S3 Express One Zone performance https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-express-optimizing-performance-design-patterns.html
[137] What is Amazon S3? https://docs.aws.amazon.com/en_us/AmazonS3/latest/userguide/Welcome.html
[138] Naming Amazon S3 objects https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-keys.html
[139] Controlling access to a bucket with user policies https://docs.aws.amazon.com/AmazonS3/latest/userguide/walkthrough1.html
[140] Amazon S3 Documentation https://www.amazonaws.cn/en/documentation-overview/amazon-s3-documentation/
[141] What are the folders in the S3 console? https://www.tecracer.com/blog/2023/01/what-are-the-folders-in-the-s3-console.html
(注:文档部分内容可能由 AI 生成)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)