DeepSeek R1-0528有哪些功能更新?
5月28日,DeepSeek R1模型完成小版本升级至DeepSeek - R1 - 0528, 在Live CodeBench中显示,性能可以媲美Openai最新的o3高版本,大家可以通过官网、APP或小程序进入对话界面,开启“深度思考”功能即可体验,API也已同步更新,调用方式不变。此次功能更新主要有如下几个方面:
思考能力提升
思考深度增强:基于DeepSeek V3 Base模型,投入更多算力优化,新版本在数学、编程和通用逻辑等测试中成绩出色,接近国际顶尖水平。例如在AIME 2025测试中,准确率从70%提升至87.5%,平均每题使用的tokens也大幅增加。
思维链蒸馏:将DeepSeek-R1-0528的思维链蒸馏后训练Qwen3-8B Base,得到的8B模型在数学测试AIME 2024中表现仅次于DeepSeek-R1-0528,超越Qwen3-8B,与Qwen3-235B相当。
幻觉问题优化
幻觉率降低:在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%~50%,结果更准确可靠。
创意写作优化
文体优化:对议论文、小说、散文等文体进行了优化,能输出篇幅更长、结构更完整的长篇作品,风格更贴近人类偏好。
工具调用支持
支持工具调用:支持工具调用功能,在Tau-Bench测评中表现良好,与OpenAI o1-high相当,但不支持在thinking中进行工具调用。
API更新
接口与调用方式不变:API已更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。
参数调整:调整了max_tokens参数的含义,用于限制模型单次输出的总长度,包括思考过程。
其他能力提升
前端代码生成:在前端代码生成、角色扮演等领域的能力有所提升。
交互动画生成:新增支持交互动画生成与演示功能,如激活参数动态可视化。
动态内容更新:在动态更新类前端任务(如实时天气信息卡片)中响应更快、细节更完善。
下载地址
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528