DeepSeek-V3/R1-671B全参数微调指南及使用教程

DeepSeek-V3/R1-671B 全参数微调指南是什么?

DeepSeek-V3/R1-671B 全参数微调指南是一个关于 DeepSeek-V3/R1-671B 模型全参数微调的开源指南,由中国科学院自动化研究所和中科闻歌联合推出。项目提供了从训练到推理的完整代码和脚本,并总结了训练和部署过程中的经验和问题解决方案。

DeepSeek-V3/R1-671B全参数微调指南及使用教程.webp

功能特点

  • 全参数微调支持:提供从训练到推理的完整代码和脚本,支持数据并行和序列并行。

  • 硬件优化:提供详细的硬件配置建议和实验结果,帮助高效利用计算资源。

  • 数据格式适配:支持 Openai 标准数据格式,并扩展了对 reasoning 数据的兼容。

  • 推理部署:支持将模型权重转换为 Hugging Face 格式,并通过 vLLM 等框架进行推理部署。

DeepSeek-V3/R1-671B 全参数微调指南用途

  • 自然语言处理:适用于文本生成、机器翻译、情感分析等任务。

  • 复杂场景推理:能够处理长篇幅文档和多领域任务,如医疗辅助诊断、金融分析等。

  • 科研与技术探索:作为技术试验平台,探索通用人工智能(AGI)的潜在路径。

  • 企业级应用:可用于智能客服、文档分析等场景,提升企业效率和决策能力。

如何使用DeepSeek-V3/R1-671B 全参数微调指南

1. 硬件配置

  • 需要 32 台服务器,每台配置:

  • 8 x NVIDIA H100 80GB GPU

  • 96 核 CPU

  • 2TB 内存

  • 100TB 共享存储

  • InfiniBand 400G 网络

2. 环境配置

conda create -n ds_env python=3.10
conda activate ds_env
pip install -r requirements.txt
cp -r ./code/xtuner /path/to/env/site-packages

3. 数据准备

数据格式示例:

{
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "用户问题"},
{"role": "assistant", "content": "思考过程\n最终回答", "loss": true}
]
}

4. 启动训练

使用 pdsh 或 slurm 启动训练:

pdsh -R ssh -w node[0-31] 'bash ./code/scripts/sft_deepseek.sh'

5. 模型权重转换

将训练结果转换为 Hugging Face 格式:

bash ./code/scripts/convert_pth_to_hf.sh

6. 推理部署

使用 vLLM 部署:

# 启动 Ray
pdsh -R ssh -w node0 "conda activate vllm && ray start --head"
pdsh -R ssh -w node1,node2,node3 "conda activate vllm && ray start --address='node0:6379'"
# 启动 vLLM
pdsh -R ssh -w node0 "vllm serve /path/to/model --tensor-parallel-size 8 --pipeline-parallel-size 4"

GitHub仓库:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

收藏
最新工具
喵记多APP
喵记多APP

快手推出的边聊天边记录的AI笔记,主要功能包括管理笔记,如剪藏、...

畅图
畅图

一款由摹客推出的AI原生可视化工具,专为个人和团队的创意表达、知...

Ztalk ai
Ztalk ai

一个AI驱动的会议实时语音翻译平台,可以与 Zoom、Googl...

Supercut
Supercut

一款屏幕录制工具,能帮你快速录下屏幕上的内容,录制的视频可以自动...

DreamShootAI
DreamShootAI

一个能帮你用照片生成各种风格图片的AI情侣照片生成工具,比如情侣...

讯飞星辰MaaS
讯飞星辰MaaS

科大讯飞开发的一款一站式AIGC内容运营平台,主要面向开发者,提...

星辰Agent开发平台
星辰Agent开发平台

讯飞星火新一代智能体Agent开发平台,助力开发者快速搭建生产级...

Drimo智能影视创作平台
Drimo智能影视创作平台

一款由追梦极客推出的面向影视、广告从业者以及AI视频创作者设计的...

码上飞
码上飞

一个需求秒变软件的全流程自动化智能开发平台,码上飞是L4级无人软...

Simular AI
Simular AI

一款专为Mac用户设计的本地AI智能助手,它能通过自然语言处理执...