不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明

DeepSeek 官方对 R1 使用说明进行了更新。此前我们集群部署的 deepseek-r1 满血版,在众人使用期间,时常会出现模型的 output 不经思考就直接输出推理结果的情况。针对这一问题,DeepSeek 官方给出了如下解决方案:

1. 请将 Temperature 设定在 0.5 至 0.7 的范围内(建议设置为 0.6),以此避免产生无尽的重复或者不连贯的输出。

2. 不要添加系统提示;所有的说明都应当涵盖在用户提示符之中。

3. 针对数学问题,建议在您的提示里添加一个指令提示:“请逐步推理,然后将最终答案放在\ boxed {}中。”

4. 在评估模型性能时,建议开展多次测试并对结果进行平均。

5. 当响应某些查询时,DeepSeek-R1 系列模型容易绕过深度思考模式(也就是输出””),这有可能给模型性能带来不利影响。为了保障模型能够进行全面的推理,官方提议:在每个输出的开头强制执行“

不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明.webp

6、官方建议使用的搜索和文件上传提示模版: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files

7、DeepSeek-R1减轻模型跳过思考直接推理的指南: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae

DeepSeek官方也更新了readme,大家可以按照官方给的readme来配置即可获得最佳使用体验。

最新readme地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

收藏
最新工具
达探星
达探星

一款TikTok达人邀约工具,特别适合TikTok小店用来爆单。...

ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...