首页 > Ai资讯 > Ai产品

Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

Voice-Pro于2024-10-06发布在Ai产品

Voice-Pro，一款集字幕、翻译和TTS于一体的多语言音频处理工具，一键安装。

Voice-Pro主要功能：

Voice-Pro支持超过90多种语言的实时翻译，适合直播或即时翻译场景。

Voice-Pro主要功能：

Studio选项卡

提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境
ffmpeg支持的所有视频/音频格式都可以使用
可选择输出音频格式（wav、flac、mp3）
100 种语言的语音识别和字幕创建
选择适合 PC 性能的字幕创建选项（Whisper 模型和计算类型）
翻译成 100 多种语言并通过 TTS 生成语音
多语言视频中保留了原始视频的BGM和音效。
支持TTS语音速度、音量、音调调节

Whisper Caption卡

专门用于创建字幕的选项卡。支持 90 多种语言
显示使用视频创建的字幕
提供世界级亮点功能
提供降噪功能（1-Demucs、2-MDXNet）

Translate选项卡

专用翻译选项卡。支持 100 多种语言
支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）
也可以直接输入文字
自动检测上传文件的语言

TTS选项卡

仅 TTS 选项卡。支持超过100种语言和400种语音
支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）
也可以直接输入文字
自动检测上传文件的语言
音调、音量和速度可调

Live Translation选项卡

实时语音识别和翻译支持
选择音频输入源，例如麦克风、扬声器等。
提供保存捕获的音频、识别的字幕和翻译的字幕的功能

Batch选项卡

批量处理大量文件
字幕、翻译、TTS

Voice-Pro特征：

您可以下载 YouTube 视频（mp4、webm）并将其另存为音频文件（mp3、wav、flac）。
您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。
通过ai语音识别，提供自动字幕制作、机器翻译、TTS功能。
您可以轻松制作多语言视频。
一键安装。安装后，您可以永久使用它，无需额外费用。 (※ 免费版有30分钟使用时间限制)
提供Web-UI 。推荐使用谷歌Chrome浏览器。

Voice-Pro项目地址：https://github.com/abus-aikorea/voice-pro

Kimi探索版:AI搜索的革新

HeyGen推出Avatar Look功能

RealtimeVoiceChat：实时收到语音回复

RealtimeVoiceChat：实时收到语音回复

2025-05-07

最新工具

AlphaShop

阿里巴巴旗下1688针对跨境从业者推出了一款AI工具，中文名叫“...

千问AI

阿里用通义千问大模型做的AI对话助手，主打“会聊天、能办事”，是...

AI PPT Maker

免费的在线AI PPT工具，通过ChatGPT和DeepSeek...

Worthsee

免费的在线音频编辑工具箱，要提供音频格式转换、裁剪、升降调等功能...

快制图表

小白也能轻松上手的图表与报表制作神器，能做饼图、折线图等常见图表...

EzRemove AI

一个在线的图片和视频处理工具，主要用来抠图去背景、去水印、去掉画...

A Real Me

一个主打“有趣+自我探索”的免费测评平台，包括性格、情商、智商、...

Music Tag Web

一款开源的 Web 音乐标签编辑器，能直接编辑服务器或本机上的音...

Planner 5D

一款面向大众的室内外设计与户型规划工具，支持2D/3D编辑与VR...

ACRCloud

一个面向企业的音频自动内容识别平台，通过靠音频指纹和元数据来查内...

用户登录

Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

相关文章

最新文章

最新工具