字节跳动OmniHuman模型已经在即梦上线内测

字节跳动上线的OmniHuman模型已经在即梦AI上线内测,该模型采用全新的多模态视频生成技术,用户只需输入一张图片和一段音频,就可以生成非常逼真真人视频动画,涵盖从面部表情到全身动作,无论是说话、唱歌、跳舞等。

未标题-1.webp

OmniHuman模型的主要功能:

  • 视频生成:能够将输入的单张照片转化为逼真的全身动态视频,叶可让数字人表现出讲话、唱歌等多种自然动作。

  • 多模态输入:同时支持肖像、半身及全身等不同尺寸的图片输入,结合音频内容,数据训练效果良好,能够生成高质量的动画视频。

OmniHuman模型不仅支持肖像和全身视频生成,还对不同类型的图片,如动漫和3D卡通等非真人图片输入,表现令人满意。即梦ai相关负责人表示,尽管OmniHuman已经表现出良好的效果,但在生成影视真实级别的视频方面仍有提升空间。OmniHuman也将将逐步开放使用,现在进行小范围内测,并设置严格的安全审核机制。

OmniHuman在哪里?

登录即梦AI,左侧栏选择视频生成。

我正在申请内测中...但用用户说是对口型,效果不是很好,但有些说很赞。

收藏
最新工具
GamePix
GamePix

全球领先的 HTML5 和 WebGL 游戏分发平台。它把各类分...

PixelSquid
PixelSquid

Shutterstock推出的专为平面设计师和Photoshop...

Dos.Zone
Dos.Zone

一个聚合经典DOS游戏的在线游玩平台,游戏种类特别多,有动作、策...

KBHgames
KBHgames

一个老牌免费在线游戏网站,谁都可以在这儿找到想玩的游戏。涵盖动作...

SoundWise AI
SoundWise AI

一个完全免费的AI音视频转录工具,能在浏览器里直接把音频和视频转...

Armor Games
Armor Games

全球知名免费在线游戏平台与独立游戏发行商​,ArmorGames...

Social Auto Upload
Social Auto Upload

社交媒体视频一键多平台发布工具​,一站式解决抖音、小红书、视频号...

在线DOS游戏
在线DOS游戏

一个能在浏览器直接玩DOS游戏的在线模拟器,适合怀旧玩家和游戏开...

HDLOGO
HDLOGO

HDLOGO 是一个专门整理矢量标志和图标的网站,提供各类品牌和...

Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...