Fish Speech

Fish Speech

Fish Audio 开发的文本转语音 (TTS) 解决方案。它提供先进的 TTS 功能并支持多种语言,完美支持中英日语言的开源TTS模型。

#Ai工具箱 #Ai语音工具
收藏

Fish Speech简介

Fish Speech 是 Fish Audio 开发的文本转语音 (TTS) 解决方案。它提供先进的 TTS 功能并支持多种语言,完美支持中英日语言的开源TTS模型,语音处理接近人类水平,模型使用约十五万小时三语数据训练,对中文支持非常的完美。

Fish Speech特点:

  • 模型版本:当前稳定版本为 Fish Speech 1.1.2,正在更新至 1.2 版本 1。初始版本 Fish Speech V1 使用 15 万小时的英语、中文和日语音频数据进行训练。

  • 许可:代码库根据 BSD-3-Clause 许可证发布,而模型根据 CC-BY-NC-SA-4.0 许可证发布。

  • 在线演示:用户可以通过 Huggingface Spaces 和 Fish Audio 2 上提供的在线演示来尝试 Fish Speech。

  • 系统要求:对于推理,需要至少 4GB 内存的 GPU,而微调则需要 16GB 的 GPU 内存。该系统同时支持Linux和Windows。

  • Windows 设置:非专业 Windows 用户可以通过提供的批处理脚本 ( install_env.bat ) 安装环境。可以选择使用镜像站点下载依赖项并启用模型编译的编译环境。

  • 致谢:Fish Speech 的发展受到多个项目的影响,包括 VITS2、Bert-VITS2、GPT VITS、MQTTS、GPT Fast 和 GPT-SoVITS。

Fish Speech.jpg

Fish Speech应用:

语音助手:Fish Speech 可以集成到语音助手平台中,以多种语言提供听起来自然的响应,可以增强用户交互性和可访问性。

有声读物旁白:高质量的语音合成使 Fish Speech 适合生成书面内容的有声读物版本。

语言学习:鱼语音支持英语、中文和日语,可用于语言学习应用程序,通过生成目标语言的语音来帮助学生练习发音和听力技能。

辅助工具:Fish Speech 可用于辅助工具中,通过将文本转换为语音来帮助视障用户。

客户服务机器人:与客户服务机器人集成可以通过自然的语音实现与客户交互。

内容创作:可以使用 Fish Speech 为视频、播客和其他多媒体内容生成画外音。

Fish Speech由 fishaudio 开发,作为一个仅有亿级参数的模型,Fish Speech 的设计非常的轻量而且高效。它可以在个人设备上轻松运行和微调,很方便成为您的私人语音助手。

github代码:https://github.com/fishaudio/fish-speech

huggingface:https://huggingface.co/fishaudio/fish-speech-1.2

相关资讯:

10款优秀的开源TTS语音模型推荐

Fish Speech 与 Google 的Tacotron或Amazon Polly等其他TTS模型相比如何?

与Fish Speech相关工具