short-video-maker:一个开源的自动化短视频创作工具

short-video-maker是什么?

short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。

short-video-maker:一个开源的自动化短视频创作工具.webp

short-video-maker功能

  • 从文本提示生成完整的短视频。

  • 文字转语音。

  • 自动字幕生成和样式设计。

  • 通过Pexels搜索和选择背景视频。

  • 背景音乐支持,可选择流派/情绪。

  • 提供REST API和模型上下文协议(MCP)服务器。

short-video-maker工作原理

  • 使用Kokoro TTS将文本转换为语音。

  • 使用Whisper生成准确的字幕。

  • 从Pexels查找相关的背景视频。

  • 使用Remotion组合所有元素。

  • 渲染出专业外观的短视频,字幕时间精准。

运行

使用NPX(推荐)

支持GPU的运行方式:

LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
需要安装Node.js环境,并通过npx命令快速启动。

使用Docker

CPU版本:

docker run -it --rm --name short-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= \
  gyoridavid/short-video-maker:latest

NVIDIA GPU版本:

docker run -it --rm --name shorts-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= --gpus=all \
  gyoridavid/short-video-maker:latest-cuda

环境变量

  • PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。

  • PORT:API/MCP服务器的端口,默认为3123。

  • LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。

  • WHISPER_VERBOSE:Whisper的详细模式,默认为false。

示例

示例JSON输入:

{
  "scenes": [
    {
      "text": "Hello world! Enjoy using this tool to create awesome ai workflows",
      "searchTerms": ["rainbow"]
    }
  ],
  "config": {
    "paddingBack": 1500,
    "music": "happy"
  }
}

输出为hello_world.mp4文件。

short-video-maker应用

  • 社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。

  • 教育领域:制作课程预告、学习资源或语言学习视频。

  • 新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。

  • 商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。

  • 教育与培训:教师或教育机构可制作教学短视频。

Github:https://github.com/gyoridavid/short-video-make


收藏
最新工具
去AIGC
去AIGC

一个AI文本人性化处理平台。它用自研引擎深度改写AI生成的内容,...

Logo.surf
Logo.surf

一个免费的可以把文字转成Logo和网站ICO图标的在线工具,你只...

SP-MangaEditor
SP-MangaEditor

一款免费的漫画编辑工具。它把 AI 画图和专业排版放在一起,可以...

MangaMaker
MangaMaker

一个用HTML、CSS 和 JavaScript做的轻量漫画制作...

TapNow AI
TapNow AI

一个专门帮电商、广告、电影和短视频行业做图片和视频的AI视觉创作...

Kimi Claw
Kimi Claw

月之暗面推出的云端AI智能体服务。它基于开源框架 OpenCla...

Code Wiki
Code Wiki

谷歌推出的一个 AI驱动的代码文档工具,用来解决软件开发里一直有...

Situation Monitor
Situation Monitor

一个做信息聚合的开源仪表盘工具,它把全球实时资讯、金融行情、地缘...

AIVideomaker AI
AIVideomaker AI

操作简单的AI视频生成工具,不用啥经验,想快速做短视频、试试创意...

Myclaw AI
Myclaw AI

一个OpenClaw托管平台。你不用折腾 Node.js 环境,...