Mercury:首个商用级别扩散大型语言模型(dLLM)

Mercury是什么?

Mercury是由创业公司Inception Labs推出的首个商用级别扩散大型语言模型(dLLM)。在Copilot Arena基准测试中,Mercury Coder速度超过了包括GPT-4o Mini和Claude 3.5 Haiku等多个现有模型。 在实际应用中,Mercury Coder能够以极快的速度生成高质量的代码。

技术原理

  • 扩散模型:Mercury采用扩散模型技术,与传统自回归模型不同,它通过“从粗到细”的生成过程,从纯噪声开始,通过多个去噪步骤逐步生成有意义的文本。

  • 并行生成:利用GPU的并行生成机制,Mercury能够在生成文本时同时修改多个token,从而显著提高生成速度和效率。

Mercury技术原理.webp

创新点

  • 速度优势:Mercury在NVIDIA H100上能以每秒超过1000 token的速度运行,比现有的经过速度优化的LLM快5到10倍。

  • 成本效益:通过新的语言生成方法,Mercury将推理成本降低了10倍,同时保持了与前沿模型相当的性能。

  • 纠错能力:扩散模型的特性使得Mercury能够在生成过程中不断改进输出,纠正错误和幻觉。

Mercury功能特征

  • 扩散模型技术:Mercury采用扩散模型,通过“从粗到细”的生成过程,从纯噪声开始,逐步生成有意义的文本。

  • 并行生成:利用GPU的并行生成机制,Mercury能够在生成文本时同时修改多个token,显著提高生成速度和效率。

  • 速度优势:在NVIDIA H100上能以每秒超过1000 token的速度运行,比现有的经过速度优化的LLM快5到10倍。

  • 成本效益:通过新的语言生成方法,Mercury将推理成本降低了10倍,同时保持了与前沿模型相当的性能。

  • 纠错能力:扩散模型的特性使得Mercury能够在生成过程中不断改进输出,纠正错误和幻觉。

Mercury功能.webp

Mercury应用

  • 编程与代码生成:Mercury Coder专门为代码生成进行了优化,在标准编码基准测试中表现优异,速度比传统模型快10倍以上。

  • Agent应用:Mercury的高速度和效率使其在需要大量规划和长篇生成的应用中表现出色,如智能客服、代码助手等。

  • 边缘应用:由于其高效性,Mercury在资源受限的环境中也能表现出色,如手机或笔记本电脑上的应用。

  • 高级推理:Mercury可以利用错误修正来修复幻觉并提升回答质量,适用于需要深度推理的任务。

  • 可控生成:Mercury可以编辑输出内容,按任意顺序生成词,适用于需要灵活生成内容的场景。

Mercury如何使用?

安装与配置:Mercury Coder已上线,可公开试用。用户可以通过Inception Labs提供的playground体验其功能,或通过API和内部部署服务进行企业级应用。

体验与测试:用户可以在Inception Labs的官方网站上体验Mercury Coder的强大能力,输入代码需求,即时生成高质量的代码。

在线体验:https://chat.inceptionlabs.ai/

官方介绍:https://www.inceptionlabs.ai/news

收藏

相关文章

最新工具
Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...

PrettyScale
PrettyScale

一个在线面部分析及颜值打分网站,用户通过上传照片或直接用摄像头参...

圆周旅迹
圆周旅迹

一款旅游出行AI智能规划APP,它可以直接从小红书这些平台导入别...

Wonderplan AI
Wonderplan AI

一个免费的AI旅游规划工具,能根据你的喜好、需求生成专属行程,支...

智写流程
智写流程

一个能自动记录网页操作并生成操作指南的工具。它能捕捉鼠标点击、键...

ReactBits
ReactBits

一个免费开源的动画化、可交互React组件库,里面有好多动画化、...

电视眼
电视眼

也叫TV眼,是一个在线网络电视直播网站,提供全国5000+个电视...

Excel Dashboard Ai
Excel Dashboard Ai

一款能自动把 Excel 或 CSV 文件变成带交互功能的仪表盘...

ByRutor
ByRutor

俄罗斯的一个免费游戏资源下载网站,提供超23,000多款游戏,涵...

RandomStreetView
RandomStreetView

一个可以随机展示全球谷歌街景照片的网站,每次点按钮,系统会随机选...