DeepSeek-V3/R1-671B全参数微调指南及使用教程

DeepSeek-V3/R1-671B 全参数微调指南是什么?

DeepSeek-V3/R1-671B 全参数微调指南是一个关于 DeepSeek-V3/R1-671B 模型全参数微调的开源指南,由中国科学院自动化研究所和中科闻歌联合推出。项目提供了从训练到推理的完整代码和脚本,并总结了训练和部署过程中的经验和问题解决方案。

DeepSeek-V3/R1-671B全参数微调指南及使用教程.webp

功能特点

  • 全参数微调支持:提供从训练到推理的完整代码和脚本,支持数据并行和序列并行。

  • 硬件优化:提供详细的硬件配置建议和实验结果,帮助高效利用计算资源。

  • 数据格式适配:支持 Openai 标准数据格式,并扩展了对 reasoning 数据的兼容。

  • 推理部署:支持将模型权重转换为 Hugging Face 格式,并通过 vLLM 等框架进行推理部署。

DeepSeek-V3/R1-671B 全参数微调指南用途

  • 自然语言处理:适用于文本生成、机器翻译、情感分析等任务。

  • 复杂场景推理:能够处理长篇幅文档和多领域任务,如医疗辅助诊断、金融分析等。

  • 科研与技术探索:作为技术试验平台,探索通用人工智能(AGI)的潜在路径。

  • 企业级应用:可用于智能客服、文档分析等场景,提升企业效率和决策能力。

如何使用DeepSeek-V3/R1-671B 全参数微调指南

1. 硬件配置

  • 需要 32 台服务器,每台配置:

  • 8 x NVIDIA H100 80GB GPU

  • 96 核 CPU

  • 2TB 内存

  • 100TB 共享存储

  • InfiniBand 400G 网络

2. 环境配置

conda create -n ds_env python=3.10
conda activate ds_env
pip install -r requirements.txt
cp -r ./code/xtuner /path/to/env/site-packages

3. 数据准备

数据格式示例:

{
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "用户问题"},
{"role": "assistant", "content": "思考过程\n最终回答", "loss": true}
]
}

4. 启动训练

使用 pdsh 或 slurm 启动训练:

pdsh -R ssh -w node[0-31] 'bash ./code/scripts/sft_deepseek.sh'

5. 模型权重转换

将训练结果转换为 Hugging Face 格式:

bash ./code/scripts/convert_pth_to_hf.sh

6. 推理部署

使用 vLLM 部署:

# 启动 Ray
pdsh -R ssh -w node0 "conda activate vllm && ray start --head"
pdsh -R ssh -w node1,node2,node3 "conda activate vllm && ray start --address='node0:6379'"
# 启动 vLLM
pdsh -R ssh -w node0 "vllm serve /path/to/model --tensor-parallel-size 8 --pipeline-parallel-size 4"

GitHub仓库:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

收藏
最新工具
达探星
达探星

一款TikTok达人邀约工具,特别适合TikTok小店用来爆单。...

ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...