高说服力数字人:基于文心多模态大模型,具备“剧本生成”能力,声形超逼真

高说服力数字人是什么?

高说服力数字人是2025年4月25日,在百度Create大会上,百度创始人李彦宏发布的数字人产品。高说服力数字人声形超逼真、内容更专业、互动更灵活,能带来超越真人的体验。它由百度电商“慧播星”平台打造,基于文心4.5大模型,具备“剧本生成”能力,能让表情、语气、动作随台词实时调整,使情绪转折和动作切换自然流畅。比如百度生成的数字人,相貌、声音、动作和神情都很逼真,几乎和真人一样。

高说服力数字人:基于文心多模态大模型,具备“剧本生成”能力,声形超逼真.webp

高说服力数字人核心技术

  • 剧本驱动多模匹配:借助大语言模型生成剧本,涵盖台词、视觉标签和语音标签生成。生成台词时,同步生成数字人的动作、表情和语调等信息,对齐各模态位置,实现多模态内容匹配和位置对齐,生成有表现力、形神兼备的数字人。

  • 多智能体调度:数字人能依据直播间实时热度和转化情况,灵活调度助播、场控、运营等角色促进转化,像适时切换镜头画面、调度图片和视频素材等,实现“一人即一支营销团队”。例如某汽车直播间,数字人主播讲解时,助播同步调出3D车型模型,转化效率提升40%。

  • 多模高度融合:可完美复刻真人与直播间装修。百度研制数字人视频生成大模型,将视频、剧本、语音等多模态信号用于数字人高可控生成,再通过影空间对齐生成足够时长的视频内容。

  • 面向数字人场景的语音合成:基于文心大模型预测文本风格、情绪及韵律起伏,通过文本自控语音合成大模型实现指令遵循合成,控制声音效果平滑流畅,结合直播文本和发音人信息,合成自然流畅的声音。

高说服力数字人应用场景

  • 电商直播:这是高说服力数字人的重要应用领域。它能不知疲倦直播,覆盖商品讲解到氛围引导全流程。如某美妆直播间,数字人导购转化率比真人高25%;“溶溶精致生活”用慧播星数字人直播,月GMV达15万+,收益提升30%;“美丽家居服工厂”GMV增长60%;美妆个护品牌“左颜右色”用数字人试妆展示,单场GMV达29万+,直播间转化率提升60%。数字人还能根据直播间实时反馈自动决策,如发放优惠券、切换商品等。

  • 其他领域:目前数字人系统正拓展到多行业,广泛应用于法律、教育、金融、汽车等垂类场景。部分汽车经销商用数字人进行车型介绍和互动问答;图书直播中,数字人能引经据典;健康产品带货时,能结合用户血糖等数据个性化推荐。法律行业的“法在心间”,新增律师数字人项目,依托慧播星脚本创作和大模型知识储备,精准解答法律问题、规避风险词,上线后线索获取成本降低75%,线索量提升近5倍。

高说服力数字人优势

  • 低门槛:百度慧播星有“一键克隆”功能,用户录一段最短2分钟的直播视频上传训练,就能拥有专属数字人,人人可当主播。还能用ai帮写直播脚本,打造个性化直播间。

  • 低成本:目前使用“高说服力数字人”直播月均成本控制在千元以内,比传统直播节省约80%。系统技术成本也在下降,过去一年下降约三分之二。在百度站内,商家借助平台扶持,几乎零成本就能开播。

高说服力数字人使用教程

  1. 录制视频:打开百度APP,搜索“慧播星”,点击“手机端一键开播”“创建数字人”。用手机录制一段2-3分钟的真人出镜视频,视频要求全程露脸,无需准备专业设备。

  2. 选择或自定义人设、主题和脚本:在等待视频上传时,可以选择慧播星准备好的人设,如情感咨询、读书分享等,AI会自动生成人设指南、直播主题和脚本。也可以自定义人设,如塑身爱好者等,并选择“AI帮我写”脚本来生成相关内容,整个脚本生成过程不到2分钟。

  3. 等待数字人制作完成:制作时间一般在3小时左右,制作好后会通过短信通知,页面也会提示开播时间。


收藏
最新工具
OpenClaw101
OpenClaw101

一个致力于帮助用户在7天内从零开始掌握OpenClaw的指南和资...

Tuduck AI
Tuduck AI

一个整合即梦AI、香蕉Pro、香蕉2、专业 Flex等AI模型,...

妙笔生花
妙笔生花

WordFlower,一款长篇网文/小说与剧本AI写作平台,擅长...

Loot Drop
Loot Drop

创业墓地,失败创业项目复盘的免费知识平台,它收集、整理并分析了超...

超级小说家
超级小说家

一款面向小说创作全流程的AI工具,定位为"从灵感到成文...

PixPark AI
PixPark AI

一个免费的通用AI图像生成与编辑平台,覆盖从生成到编辑的完整流程...

魔因漫创
魔因漫创

AI 影视生产级工具,支持 Seedance2.0,剧本、角色、...

PopShort.AI
PopShort.AI

一个AI短剧创作平台。它有个核心想法,就是“一个人就能组成一支制...

Gaga AI
Gaga AI

Sand.ai团队开发的全球首个专注于“人物对话”场景的影视级A...

Story-Iter
Story-Iter

UCSC-VLAA提出的长故事可视化解决方案。可根据叙事文本生成...