OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念

Mark Chen (@markchen90)1月28 日

OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念.webp

祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。

然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。

但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!

随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。

我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!

收藏
最新工具
巨鲸写作
巨鲸写作

一个AI论文写作助手,主打“写得快、改得准、数据能做成图”。不少...

Office Tab
Office Tab

Microsoft Office插件,能加上“标签页”功能。用W...

YPrompt
YPrompt

一个AI提示词管理和优化的工具。主要功能是通过 AI 对话了解用...

Voicv语音克隆
Voicv语音克隆

一个AI语音克隆和文字转语音的平台,只要几秒就能复制一个声音,做...

Cartoonize AI
Cartoonize AI

一个专门把照片变成卡通图的工具。它能把真人照片、宠物照、全身照很...

Betrayal.io
Betrayal.io

一款免费的多人在线社交推理游戏,玩法参考了《Among Us》《...

Cut the Rope
Cut the Rope

(Cut the Rope)《割绳子》是 ZeptoLab 做、...

Nodejam
Nodejam

一款整合多种办公功能的AI办公套件,主要把文本、电子表格和演示文...

image to prompt
image to prompt

一个免费且无需登录的图片转提示词工具,主要功能是免费将上传的图片...

Dayflow
Dayflow

一个开源的macOS原生应用,主要做的是不用手动操作,也能知道你...