不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明

DeepSeek 官方对 R1 使用说明进行了更新。此前我们集群部署的 deepseek-r1 满血版,在众人使用期间,时常会出现模型的 output 不经思考就直接输出推理结果的情况。针对这一问题,DeepSeek 官方给出了如下解决方案:

1. 请将 Temperature 设定在 0.5 至 0.7 的范围内(建议设置为 0.6),以此避免产生无尽的重复或者不连贯的输出。

2. 不要添加系统提示;所有的说明都应当涵盖在用户提示符之中。

3. 针对数学问题,建议在您的提示里添加一个指令提示:“请逐步推理,然后将最终答案放在\ boxed {}中。”

4. 在评估模型性能时,建议开展多次测试并对结果进行平均。

5. 当响应某些查询时,DeepSeek-R1 系列模型容易绕过深度思考模式(也就是输出””),这有可能给模型性能带来不利影响。为了保障模型能够进行全面的推理,官方提议:在每个输出的开头强制执行“

不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明.webp

6、官方建议使用的搜索和文件上传提示模版: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files

7、DeepSeek-R1减轻模型跳过思考直接推理的指南: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae

DeepSeek官方也更新了readme,大家可以按照官方给的readme来配置即可获得最佳使用体验。

最新readme地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

收藏
最新工具
CodeWords
CodeWords

一个通过自然语言对话就能创建和执行自动化任务的AI工具。它能简化...

Scrumball
Scrumball

一个网红营销平台,能自动完成找网红到活动追踪的全流程。它有超过1...

LogoSymbol
LogoSymbol

一个提供免费高质量矢量LOGO的网站,有1207多个经过AI优化...

CloneViral AI
CloneViral AI

一个AI视频生成平台,专门帮视频博主做能在YouTube和Tik...

SlideStorm AI
SlideStorm AI

一款AI驱动的TikTok幻灯片生成工具,能帮用户在几秒内创建并...

Oreate AI
Oreate AI

一个面向学术和内容创作的工具。它能生成论文、文章、PPT等长篇内...

LLaMA-Factory Online
LLaMA-Factory Online

是和开源项目LLaMA-Factory官方合作的在线平台,专门帮...

TripAdvisor
TripAdvisor

中文网猫途鹰,在线旅行服务平台,有超过十亿条真实用户点评,覆盖酒...

涂鹿Toolooz
涂鹿Toolooz

免费的沿路径排列文字在线设计工具,能让你用鼠标或触控笔自由画路径...

AllWebGames
AllWebGames

一个提供丰富免费在线网页游戏的平台,不用注册也不用下载,打开浏览...