DeepSeek-V3/R1-671B全参数微调指南及使用教程

DeepSeek-V3/R1-671B 全参数微调指南是什么?

DeepSeek-V3/R1-671B 全参数微调指南是一个关于 DeepSeek-V3/R1-671B 模型全参数微调的开源指南,由中国科学院自动化研究所和中科闻歌联合推出。项目提供了从训练到推理的完整代码和脚本,并总结了训练和部署过程中的经验和问题解决方案。

DeepSeek-V3/R1-671B全参数微调指南及使用教程.webp

功能特点

  • 全参数微调支持:提供从训练到推理的完整代码和脚本,支持数据并行和序列并行。

  • 硬件优化:提供详细的硬件配置建议和实验结果,帮助高效利用计算资源。

  • 数据格式适配:支持 Openai 标准数据格式,并扩展了对 reasoning 数据的兼容。

  • 推理部署:支持将模型权重转换为 Hugging Face 格式,并通过 vLLM 等框架进行推理部署。

DeepSeek-V3/R1-671B 全参数微调指南用途

  • 自然语言处理:适用于文本生成、机器翻译、情感分析等任务。

  • 复杂场景推理:能够处理长篇幅文档和多领域任务,如医疗辅助诊断、金融分析等。

  • 科研与技术探索:作为技术试验平台,探索通用人工智能(AGI)的潜在路径。

  • 企业级应用:可用于智能客服、文档分析等场景,提升企业效率和决策能力。

如何使用DeepSeek-V3/R1-671B 全参数微调指南

1. 硬件配置

  • 需要 32 台服务器,每台配置:

  • 8 x NVIDIA H100 80GB GPU

  • 96 核 CPU

  • 2TB 内存

  • 100TB 共享存储

  • InfiniBand 400G 网络

2. 环境配置

conda create -n ds_env python=3.10
conda activate ds_env
pip install -r requirements.txt
cp -r ./code/xtuner /path/to/env/site-packages

3. 数据准备

数据格式示例:

{
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "用户问题"},
{"role": "assistant", "content": "思考过程\n最终回答", "loss": true}
]
}

4. 启动训练

使用 pdsh 或 slurm 启动训练:

pdsh -R ssh -w node[0-31] 'bash ./code/scripts/sft_deepseek.sh'

5. 模型权重转换

将训练结果转换为 Hugging Face 格式:

bash ./code/scripts/convert_pth_to_hf.sh

6. 推理部署

使用 vLLM 部署:

# 启动 Ray
pdsh -R ssh -w node0 "conda activate vllm && ray start --head"
pdsh -R ssh -w node1,node2,node3 "conda activate vllm && ray start --address='node0:6379'"
# 启动 vLLM
pdsh -R ssh -w node0 "vllm serve /path/to/model --tensor-parallel-size 8 --pipeline-parallel-size 4"

GitHub仓库:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

收藏
最新工具
Radiocast
Radiocast

一个能听到全球广播的在线平台。界面像三维地球,点一下上面的城市或...

易纸
易纸

一个免费的在线稿纸打印工具,支持方格纸、竖线纸、毛笔字帖、作文纸...

装个机ZhuangIt
装个机ZhuangIt

一个手把手教你自己装系统、重装电脑的实用网站,提供从备份到激活的...

PinMe
PinMe

一款简单实用的去中心化部署工具,能降低个人网站和作品展示的技术门...

RoboNeo
RoboNeo

美图公司推出的 AI 视觉工具,能通过文字交流实现修图、设计、视...

JellyMario
JellyMario

一款改自经典的《超级马里奥》的网页游戏。游戏里的角色、敌人和场景...

MyAITeachers AI吾师
MyAITeachers AI吾师

一个面向 8 岁以上学习者的AI学习辅导工具,有多位 AI 老师...

Presenton
Presenton

一个可以本地运行的开源AI PPT生成器,使用OpenAI、Ge...

Eigent AI
Eigent AI

全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分...

NB Map
NB Map

灰色执照做的免费在线三维地图生成工具。它能根据真实地形数据,做出...