不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明

DeepSeek 官方对 R1 使用说明进行了更新。此前我们集群部署的 deepseek-r1 满血版,在众人使用期间,时常会出现模型的 output 不经思考就直接输出推理结果的情况。针对这一问题,DeepSeek 官方给出了如下解决方案:

1. 请将 Temperature 设定在 0.5 至 0.7 的范围内(建议设置为 0.6),以此避免产生无尽的重复或者不连贯的输出。

2. 不要添加系统提示;所有的说明都应当涵盖在用户提示符之中。

3. 针对数学问题,建议在您的提示里添加一个指令提示:“请逐步推理,然后将最终答案放在\ boxed {}中。”

4. 在评估模型性能时,建议开展多次测试并对结果进行平均。

5. 当响应某些查询时,DeepSeek-R1 系列模型容易绕过深度思考模式(也就是输出””),这有可能给模型性能带来不利影响。为了保障模型能够进行全面的推理,官方提议:在每个输出的开头强制执行“

不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明.webp

6、官方建议使用的搜索和文件上传提示模版: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files

7、DeepSeek-R1减轻模型跳过思考直接推理的指南: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae

DeepSeek官方也更新了readme,大家可以按照官方给的readme来配置即可获得最佳使用体验。

最新readme地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

收藏
最新工具
喵记多APP
喵记多APP

快手推出的边聊天边记录的AI笔记,主要功能包括管理笔记,如剪藏、...

畅图
畅图

一款由摹客推出的AI原生可视化工具,专为个人和团队的创意表达、知...

Ztalk ai
Ztalk ai

一个AI驱动的会议实时语音翻译平台,可以与 Zoom、Googl...

Supercut
Supercut

一款屏幕录制工具,能帮你快速录下屏幕上的内容,录制的视频可以自动...

DreamShootAI
DreamShootAI

一个能帮你用照片生成各种风格图片的AI情侣照片生成工具,比如情侣...

讯飞星辰MaaS
讯飞星辰MaaS

科大讯飞开发的一款一站式AIGC内容运营平台,主要面向开发者,提...

星辰Agent开发平台
星辰Agent开发平台

讯飞星火新一代智能体Agent开发平台,助力开发者快速搭建生产级...

Drimo智能影视创作平台
Drimo智能影视创作平台

一款由追梦极客推出的面向影视、广告从业者以及AI视频创作者设计的...

码上飞
码上飞

一个需求秒变软件的全流程自动化智能开发平台,码上飞是L4级无人软...

Simular AI
Simular AI

一款专为Mac用户设计的本地AI智能助手,它能通过自然语言处理执...