10款优秀的开源TTS语音模型推荐

10款优秀的开源TTS语音模型推荐.jpg

在平时的语音合成TTS整理中,目前有许多优秀的文本转语音(TTS)模型可以推荐,以下是我整理的一些在研究和实际应用中表现突出的10款优秀TTS语音模型:

1、GPT-SoVITS

ai 卖货主播大模型Streamer-Sales销冠用的这款TTS模型,支持英语、日语和中文,零样本文本到语音(TTS)。

集成工具包:github:https://github.com/RVC-Boss/GPT-SoVITS

2、Fish Speech v1.2

效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。

模型:https://huggingface.co/fishaudio/fish-speech-1.2

在线版:https://fish.audio/zh-CN/

3、字节的Seed-TTS(不开源)

支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成,能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音。

项目:https://bytedancespeech.github.io/seedtts_tech_report/

4、ChatTTS

对话式 TTS(可多人),支持中英文,韵律细腻。

github:https://github.com/2noise/ChatTTS

模型:https://huggingface.co/2Noise/ChatTTS/tree/main

5、Parler-TTS

可以控制音调、速度、性别、噪音水平、情绪特征等等

github:https://github.com/huggingface/parler-tts

模型:https://huggingface.co/parler-tts

6、MetaVoice-1B

支持多语言,在英语处理上实现了情感语音节奏

github:https://github.com/metavoiceio/metavoice-src

7、MARS5-TTS

MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音

github:https://github.com/Camb-ai/MARS5-TTS

8、OpenVoice

原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。

github:https://github.com/myshell-ai/OpenVoice

9、EmotiVoice

支持中英文双语,包含2000多种不同的音色

github:https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md

10、StyleTTS2

近乎人类水平的文本转语音库,它利用风格扩散和对抗训练与大型语音语言模型 (SLM) 来实现人类水平的 TTS 合成。

github:https://github.com/yl4579/StyleTTS2

以上是我整理的10款优秀TTS语音模型,这些模型在不同的应用场景和硬件配置下各有优劣,选择合适的模型需要根据具体应用和资源进行评估。

收藏
#文字转语音 #文本转AI语音 #语音合成 #在线文字转语音

相关文章

最新工具
智标领航
智标领航

一款专注于招投标业务的人工智能平台,专注企业投标业务流程的AI助...

菜鸟图标
菜鸟图标

20,0000+免费高品质商用矢量图标库,设计师与开发者的灵感宝...

Chichi-Pui
Chichi-Pui

一个专注于AI生成图像的日本网站,只要针对动漫爱好者、数字艺术家...

PaperTT
PaperTT

采用先进的AI大模型技术结合国内外海量论文数据和丰富的论文辅导经...

Relingo
Relingo

帮助你在浏览任何网页的时候自动提取生词、划词划句翻译、全文沉浸式...

一字幕
一字幕

一款免费的借助AI,利用音、视频,高效辅助习得外语的视频字幕工具...

图表秀
图表秀

简单好用的在线图表制作网站,图表秀支持快速制作各种传统图表和高级...

九歌
九歌

清华大学自然语言处理与社会人文计算实验室研发的AI诗歌写作系统。...

智能对联生成器
智能对联生成器

一款专业的AI对联创作工具,它能够根据用户的要求快速生成对仗工整...

不坑盒子
不坑盒子

一款免费的支持Word、Excel、PPT、WPS三件套的全能O...