Ai应用
Ai资讯
AI生图
AI生视频
开源AI应用平台

首页 > Ai资讯 > Ai产品

Speech-02：MiniMax Audio新发布的一款强大的文本转语音（TTS）模型

Speech-02于2025-04-01发布在Ai产品

Speech-02是什么？

MiniMax Audio Speech-02是一款强大的文本转语音（TTS）模型，能够将任何文件或URL瞬间转化为逼真的音频。它支持高达20万字符的单次输入，覆盖30多种语言，并带有地道口音。此外，Speech-02还支持无限语音克隆、亚秒级流媒体处理以及多种音频格式（如FLAC、WAV、MP3和PCM）。

Speech-02模型提供两种版本：speech-02-hd-preview（以99%的语音相似度和工作室级清晰度为特点，适合配音、有声书等需要逼真表现的场景）和speech-02-turbo-preview（在低延迟和高性能之间取得平衡，适合实时应用）。

Speech-02：MiniMax Audio新发布的一款强大的文本转语音（TTS）模型.webp

语言与语音能力

多语言支持：Speech-02支持30多种语言的文本转语音，包括英语、中文、日语、韩语、法语、德语、西班牙语、葡萄牙语、意大利语、阿拉伯语、俄语、土耳其语、荷兰语、乌克兰语、越南语、印地语、泰语、波兰语、罗马尼亚语、希腊语、芬兰语和印尼语等，且带有地道口音。
语音库丰富：拥有300多个真实自然的声音，支持多种语言的地道表达。

技术性能

单次输入字符数：单次输入支持高达20万字符。
流媒体处理速度：支持亚秒级流媒体处理。
模型版本：包括speech-02-hd-preview和speech-02-turbo-preview。前者以99%的语音相似度和工作室级清晰度为特点，适合配音、有声书等需要逼真表现的场景；后者则在低延迟和高性能之间取得平衡，适合实时应用。

Speech-02功能特性

无限语音克隆：能够以行业领先的质量，快速克隆出多种风格和语调的语音。
语音控制：用户可以轻松控制语音的情感、音量、速度和输出格式。
语音混合：可以将现有的语音组合起来，创造出全新的独特语音。
音频格式支持：支持FLAC、WAV、MP3和PCM等多种音频格式。

Speech-02应用场景

有声书制作：适合将长篇小说、学术论文等转化为高质量的音频内容。
播客创作：帮助播客创作者制作更具吸引力和多样性的内容。
电影与游戏配音：提供电影级低音和沉浸式音频效果。
国际会议与翻译：支持在多种语言之间即时无缝切换。

目前，Speech-02模型已经在MiniMax Audio平台及API平台上线，但国内版尚未推出。

官方链接

MiniMax Audio平台：https://www.minimax.io/audio

MiniMax Audio API平台：https://www.minimax.io/platform

收藏

#文本转AI语音

Saber：一款效果跟纸质手写的跨平台开源笔记应用

上一篇

Saber：一款效果跟纸质手写的跨平台开源笔记应用

Amazon Nova Act：亚马逊推出的具备操控网页浏览器并自主执行简单任务的的AI智能体

下一篇

Amazon Nova Act：亚马逊推出的具备操控网页浏览器并自主执行简单任务的的AI智能体

相关文章

Kyutai TTS：专为实时场景设计的开源文本转语

Kyutai TTS：专为实时场景设计的开源文本转语

2025-07-05

llasa 3B TTS：基于LLaMA架构的文本到

llasa 3B TTS：基于LLaMA架构的文本到

2025-01-25

Noiz AI配音使用教程指南

Noiz AI配音使用教程指南

2025-04-12

OpenAI 发布了三款全新语音模型，包括两款语音转

OpenAI 发布了三款全新语音模型，包括两款语音转

2025-03-21

Llasa:一款基于Llama的文本转语音（TTS）

Llasa:一款基于Llama的文本转语音（TTS）

2025-03-04

Octave：Hume AI发布的一款TTS模型，可

Octave：Hume AI发布的一款TTS模型，可

2025-02-27

最新文章

最新工具

法大大iTerms

法大大推出的一站式法律AI工作台，基于自研法律大模型的AI智能体...

Relume

一个通过AI来优化网站设计与搭建流程的平台，可以快速生成网站地图...

Pomelli

Google开发的AI营销工具，主要服务中小商家。你只需要提供企...

Gartic.io

一个很受欢迎的在线绘画猜词游戏。它把经典的“你画我猜”玩法和多人...

LandPPT

一个基于大语言模型的开源免费AIPPT生成平台，支持将文档内容自...

AppleWalls

一个免费提供苹果官方内置壁纸下载的网站，包括iPhone、iPa...

Coddy.Tech

一个免费、有趣且实用的编程学习平台。支持学习包括 Python、...

森林电台Tree.FM

一个能让你收听世界各地森林声音的网站。通过随机收听功能，你可以沉...

Sweezy Cursors

一个提供免费鼠标光标的网站，支持Chrome浏览器和...

YumCheck

一款能帮用户解析食品包装上的营养成分标签，评估食品是否健康的免费...

人生若只如初见

用户登录