10款优秀的开源TTS语音模型推荐

10款优秀的开源TTS语音模型推荐.jpg

在平时的语音合成TTS整理中,目前有许多优秀的文本转语音(TTS)模型可以推荐,以下是我整理的一些在研究和实际应用中表现突出的10款优秀TTS语音模型:

1、GPT-SoVITS

ai 卖货主播大模型Streamer-Sales销冠用的这款TTS模型,支持英语、日语和中文,零样本文本到语音(TTS)。

集成工具包:github:https://github.com/RVC-Boss/GPT-SoVITS

2、Fish Speech v1.2

效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。

模型:https://huggingface.co/fishaudio/fish-speech-1.2

在线版:https://fish.audio/zh-CN/

3、字节的Seed-TTS(不开源)

支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成,能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音。

项目:https://bytedancespeech.github.io/seedtts_tech_report/

4、ChatTTS

对话式 TTS(可多人),支持中英文,韵律细腻。

github:https://github.com/2noise/ChatTTS

模型:https://huggingface.co/2Noise/ChatTTS/tree/main

5、Parler-TTS

可以控制音调、速度、性别、噪音水平、情绪特征等等

github:https://github.com/huggingface/parler-tts

模型:https://huggingface.co/parler-tts

6、MetaVoice-1B

支持多语言,在英语处理上实现了情感语音节奏

github:https://github.com/metavoiceio/metavoice-src

7、MARS5-TTS

MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音

github:https://github.com/Camb-ai/MARS5-TTS

8、OpenVoice

原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。

github:https://github.com/myshell-ai/OpenVoice

9、EmotiVoice

支持中英文双语,包含2000多种不同的音色

github:https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md

10、StyleTTS2

近乎人类水平的文本转语音库,它利用风格扩散和对抗训练与大型语音语言模型 (SLM) 来实现人类水平的 TTS 合成。

github:https://github.com/yl4579/StyleTTS2

以上是我整理的10款优秀TTS语音模型,这些模型在不同的应用场景和硬件配置下各有优劣,选择合适的模型需要根据具体应用和资源进行评估。

收藏
#文字转语音 #文本转AI语音 #语音合成 #在线文字转语音
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...