Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

Voice-Pro,一款集字幕、翻译和TTS于一体的多语言音频处理工具 ,一键安装。

Voice-Pro主要功能:

Voice-Pro支持超过90多种语言的实时翻译,适合直播或即时翻译场景。

Voice-Pro主要功能:

Studio选项卡

  • 提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境

  • ffmpeg支持的所有视频/音频格式都可以使用

  • 可选择输出音频格式(wav、flac、mp3)

  • 100 种语言的语音识别和字幕创建

  • 选择适合 PC 性能的字幕创建选项(Whisper 模型和计算类型)

  • 翻译成 100 多种语言并通过 TTS 生成语音

  • 多语言视频中保留了原始视频的BGM和音效。

  • 支持TTS语音速度、音量、音调调节

Whisper Caption卡

  • 专门用于创建字幕的选项卡。支持 90 多种语言

  • 显示使用视频创建的字幕

  • 提供世界级亮点功能

  • 提供降噪功能(1-Demucs、2-MDXNet)

Translate选项卡

  • 专用翻译选项卡。支持 100 多种语言

  • 支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)

  • 也可以直接输入文字

  • 自动检测上传文件的语言

TTS选项卡

  • 仅 TTS 选项卡。支持超过100种语言和400种语音

  • 支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)

  • 也可以直接输入文字

  • 自动检测上传文件的语言

  • 音调、音量和速度可调

Live Translation选项卡

  • 实时语音识别和翻译支持

  • 选择音频输入源,例如麦克风、扬声器等。

  • 提供保存捕获的音频、识别的字幕和翻译的字幕的功能

Batch选项卡

  • 批量处理大量文件

  • 字幕、翻译、TTS

Voice-Pro特征:

  • 您可以下载 YouTube 视频(mp4、webm)并将其另存为音频文件(mp3、wav、flac)。

  • 您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。

  • 通过ai语音识别,提供自动字幕制作、机器翻译、TTS功能。

  • 您可以轻松制作多语言视频。

  • 一键安装。安装后,您可以永久使用它,无需额外费用。 (※ 免费版有30分钟使用时间限制)

  • 提供Web-UI 。推荐使用谷歌Chrome浏览器。

Voice-Pro项目地址:https://github.com/abus-aikorea/voice-pro


收藏
最新工具
Hyper3D AI
Hyper3D AI

由Deemos Tech开发的AI 3D模型生成平台。它的主要产...

TOOLFK在线工具箱
TOOLFK在线工具箱

一个功能全、使用方便的免费在线工具箱,不用注册或下载,打开就能用...

绘蛙AI消除
绘蛙AI消除

阿里巴巴旗下绘蛙平台推出的修图功能,主打“哪里不要抹哪里”的一键...

Dreamega AI
Dreamega AI

免费的音视频图片创作平台,集合了OpenAI、Google、字节...

Refly AI Native创作引擎
Refly AI Native创作引擎

一个面向零基础用户的AI自动化工作流平台。即使你不会编程,基于自...

Generals.io
Generals.io

一款快节奏的在线多人策略对战游戏。玩家的目标是保护自己的将军,通...

16Personalities中文
16Personalities中文

全球很受欢迎的 MBTI 人格测试网站之一,提供免费人格测试、类...

AI Ping
AI Ping

一个专注大模型API服务的平台,围绕开发者需求提供评测整合数十家...

Howcast
Howcast

一个免费的日常学习网站,Howcast主要提供 3 万多条实用教...

GetDraft AI
GetDraft AI

得到团队推出的AI写作平台,定位是成为你的AI写作团队。它通过多...