OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念

Mark Chen (@markchen90)1月28 日

OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念.webp

祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。

然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。

但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!

随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。

我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!

收藏
最新工具
软件自学网
软件自学网

一个教各类软件的在线学习网站,主要教CAD、UG、SolidWo...

AdpexAI
AdpexAI

一个一站式生成式在线AI工具平台,不用装软件,打开浏览器就能用。...

Fiddl.art
Fiddl.art

支持自定义模型、创作和赚钱的AI 艺术生成平台,想法就是把创作、...

Dr.Watermark
Dr.Watermark

一个AI在线去水印工具,能自己找到并去掉图片里的字、Logo、全...

CityWalks.live
CityWalks.live

一个能在线逛城市的直播平台,有阿姆斯特丹、纽约、东京这些国家和地...

Talkpal AI
Talkpal AI

是一个用“口语对话”来学语言的AI学习工具,主打与AI导师进行实...

NeoDomain
NeoDomain

智灵新境AI创意工坊,用AI帮你把想法快速变成视频、图片等创意作...

飞象老师
飞象老师

猿辅导旗下飞象星球推出国内首个教师专用AI工具“飞象老师”,该工...

花生AI
花生AI

B站面向视频创作者的AIGC一站式剪辑工具,主要给UP主、MCN...

Habitica
Habitica

一个免费的习惯养成和效率工具,能用手机或者网页来管习惯、每日目标...