short-video-maker:一个开源的自动化短视频创作工具

short-video-maker是什么?

short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。

short-video-maker:一个开源的自动化短视频创作工具.webp

short-video-maker功能

  • 从文本提示生成完整的短视频。

  • 文字转语音。

  • 自动字幕生成和样式设计。

  • 通过Pexels搜索和选择背景视频。

  • 背景音乐支持,可选择流派/情绪。

  • 提供REST API和模型上下文协议(MCP)服务器。

short-video-maker工作原理

  • 使用Kokoro TTS将文本转换为语音。

  • 使用Whisper生成准确的字幕。

  • 从Pexels查找相关的背景视频。

  • 使用Remotion组合所有元素。

  • 渲染出专业外观的短视频,字幕时间精准。

运行

使用NPX(推荐)

支持GPU的运行方式:

LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
需要安装Node.js环境,并通过npx命令快速启动。

使用Docker

CPU版本:

docker run -it --rm --name short-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= \
  gyoridavid/short-video-maker:latest

NVIDIA GPU版本:

docker run -it --rm --name shorts-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= --gpus=all \
  gyoridavid/short-video-maker:latest-cuda

环境变量

  • PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。

  • PORT:API/MCP服务器的端口,默认为3123。

  • LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。

  • WHISPER_VERBOSE:Whisper的详细模式,默认为false。

示例

示例JSON输入:

{
  "scenes": [
    {
      "text": "Hello world! Enjoy using this tool to create awesome ai workflows",
      "searchTerms": ["rainbow"]
    }
  ],
  "config": {
    "paddingBack": 1500,
    "music": "happy"
  }
}

输出为hello_world.mp4文件。

short-video-maker应用

  • 社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。

  • 教育领域:制作课程预告、学习资源或语言学习视频。

  • 新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。

  • 商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。

  • 教育与培训:教师或教育机构可制作教学短视频。

Github:https://github.com/gyoridavid/short-video-make


收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...