OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念

Mark Chen (@markchen90)1月28 日

OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念.webp

祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。

然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。

但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!

随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。

我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!

收藏
最新工具
WindowSwap
WindowSwap

一个让用户可以上传和观看来自世界各地的窗外10分钟高清视频的在线...

Ventusky
Ventusky

一个全球天气信息网站,提供天气预报、天气地图和雷达服务。 它可以...

FreeSewing
FreeSewing

一个利用用户的身体测量数据生成完全量身定制的缝纫纸样的开源平台,...

Social Catfish
Social Catfish

一个专注于帮助用户识别和防范网络诈骗的网站,能帮用户防诈骗、核实...

jitter
jitter

一款浏览器上的动效设计工具,可以在无限画布上安排不同尺寸和版本的...

51mee我要米
51mee我要米

一个帮HR和招聘团队管理简历的工具。不用改变原来的招聘方式,只要...

ibisPaint
ibisPaint

一款绘画应用,它特别受欢迎,因为你可以用它记录绘画过程,还能创作...

TrendRadar
TrendRadar

一个以轻量、易部署为目标的热点助手工具,帮助用户告别信息过载,通...

FlyOrDie
FlyOrDie

一个面向全球玩家的在线游戏平台,提供多种棋类和体育项目。这里有国...

蝉妈妈AI
蝉妈妈AI

蝉妈妈新推出的AI助手,结合了六年积累的抖音和快手交易、流量及达...