DeepSeek开源周第五天开源项目:3FS,高性能分布式文件系统。

这边GPT4.5刚发布,这边 DeepSeek开源周进入到第五天开源的项目,最后一天的开源项目是:3FS(Fire-Flyer File System)。

3FS(Fire-Flyer File System)是什么?

3FS(Fire-Flyer File System)是DeepSeek自研的高性能分布式文件系统,专为解决ai训练和推理工作负载的挑战而设计。

DeepSeek开源周第五天开源项目:3FS,高性能分布式文件系统。.webp

3FS的特征

高性能:

  • 利用现代SSD和RDMA网络,提供高吞吐量和低延迟的数据访问。

  • 结合数千个SSD的吞吐量和数百个存储节点的网络带宽,使应用能够以无关地域的方式访问存储资源。

强一致性:

  • 通过实现链式复制与分配查询(CRAQ),确保强一致性,使得应用代码更简洁且易于推理。

文件接口:

  • 采用无状态元数据服务,背后支持事务型键值存储(如FoundationDB)。

  • 熟悉的文件接口,无需学习新的存储API。

多样化工作负载支持:

  • 数据准备:将数据分析管道的输出组织成层次化目录结构,有效管理大量中间输出。

  • 数据加载器:通过支持跨计算节点随机访问训练样本,消除预读取或数据洗牌的需求。

检查点:支持大规模训练的高吞吐量并行检查点。

  • 推理KV缓存:提供一种基于成本效益的替代方案,替代DRAM缓存,提供更高吞吐量并大大提高容量。

存算分离:

  • 数据存储服务与计算节点分离,专门用于存储模型训练需要用到的样本数据。

  • 每个存储服务节点有16张各15TB的SSD硬盘和2张高速网卡,读取性能强劲,网络带宽强大,读写带宽:7.0TB/秒。

自研通信工具

  • 如hfreduce,优化多卡并行通信,替代英伟达的NCCL,减少PCIe流量和计算开销。

专用数据格式FFRecord:

  • 通过合并多个小文件,减少了训练时打开大量小文件的开销。

  • 通过样本文件的偏移量提升随机批量读取性能。

3FS的应用

AI训练和推理:

  • 3FS专为AI训练和推理工作负载设计,能够显著提升这些任务的效率。

  • 通过高性能和强一致性,3FS支持大规模模型训练和高吞吐量推理。

数据准备和加载:

  • 3FS的数据准备和加载器功能使得处理大量数据变得更加高效,减少了预读取和数据洗牌的需求。

检查点和推理缓存:

  • 3FS支持高吞吐量的并行检查点,确保训练过程的稳定性和容错性。

  • 推理KV缓存提供了基于成本效益的替代方案,提高了推理吞吐量和容量。

3FS的使用

安装和配置:

  • 3FS可以通过GitHub上的开源项目进行安装和配置。

数据格式转换:

  • 使用FFRecord格式进行数据存储和加载,需要将样本数据转换成FFRecord格式。

  • 提供了FFRecord转换工具,方便用户进行数据格式转换。

与PyTorch集成:

  • 3FS适配了PyTorch的Dataset和Dataloader接口,可以非常方便地加载数据并发起训练。

GitHub项目地址:https://github.com/deepseek-ai/3FS

前四天开源项目回顾

第一天:FlashMLA,针对NVIDIA Hopper GPU的高效解码内核,优化了多头潜在注意力(MLA)的性能,显著提升了AI工具在内容创作中的响应速度。

第二天:DeepeEP,首个用于混合专家模型(MoE)训练和推理的开源通信库,优化了大规模分布式训练的通信效率,降低了延迟。

第三天:DeepGEMM,支持稠密和MoE模型的FP8计算库,专为NVIDIA Hopper架构GPU设计,显著提高了计算效率和硬件利用率。

第四天:DualPipe,一种双向流水线并行算法,旨在优化V3/R1模型训练中的计算和通信重叠。EPLB,一个专家并行负载均衡器,专门用于解决大规模AI模型中专家并行任务的负载不均衡问题。

收藏
最新工具
Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...

PrettyScale
PrettyScale

一个在线面部分析及颜值打分网站,用户通过上传照片或直接用摄像头参...

圆周旅迹
圆周旅迹

一款旅游出行AI智能规划APP,它可以直接从小红书这些平台导入别...

Wonderplan AI
Wonderplan AI

一个免费的AI旅游规划工具,能根据你的喜好、需求生成专属行程,支...

智写流程
智写流程

一个能自动记录网页操作并生成操作指南的工具。它能捕捉鼠标点击、键...

ReactBits
ReactBits

一个免费开源的动画化、可交互React组件库,里面有好多动画化、...

电视眼
电视眼

也叫TV眼,是一个在线网络电视直播网站,提供全国5000+个电视...

Excel Dashboard Ai
Excel Dashboard Ai

一款能自动把 Excel 或 CSV 文件变成带交互功能的仪表盘...

ByRutor
ByRutor

俄罗斯的一个免费游戏资源下载网站,提供超23,000多款游戏,涵...

RandomStreetView
RandomStreetView

一个可以随机展示全球谷歌街景照片的网站,每次点按钮,系统会随机选...