short-video-maker:一个开源的自动化短视频创作工具

short-video-maker是什么?

short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。

short-video-maker:一个开源的自动化短视频创作工具.webp

short-video-maker功能

  • 从文本提示生成完整的短视频。

  • 文字转语音。

  • 自动字幕生成和样式设计。

  • 通过Pexels搜索和选择背景视频。

  • 背景音乐支持,可选择流派/情绪。

  • 提供REST API和模型上下文协议(MCP)服务器。

short-video-maker工作原理

  • 使用Kokoro TTS将文本转换为语音。

  • 使用Whisper生成准确的字幕。

  • 从Pexels查找相关的背景视频。

  • 使用Remotion组合所有元素。

  • 渲染出专业外观的短视频,字幕时间精准。

运行

使用NPX(推荐)

支持GPU的运行方式:

LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
需要安装Node.js环境,并通过npx命令快速启动。

使用Docker

CPU版本:

docker run -it --rm --name short-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= \
  gyoridavid/short-video-maker:latest

NVIDIA GPU版本:

docker run -it --rm --name shorts-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= --gpus=all \
  gyoridavid/short-video-maker:latest-cuda

环境变量

  • PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。

  • PORT:API/MCP服务器的端口,默认为3123。

  • LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。

  • WHISPER_VERBOSE:Whisper的详细模式,默认为false。

示例

示例JSON输入:

{
  "scenes": [
    {
      "text": "Hello world! Enjoy using this tool to create awesome ai workflows",
      "searchTerms": ["rainbow"]
    }
  ],
  "config": {
    "paddingBack": 1500,
    "music": "happy"
  }
}

输出为hello_world.mp4文件。

short-video-maker应用

  • 社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。

  • 教育领域:制作课程预告、学习资源或语言学习视频。

  • 新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。

  • 商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。

  • 教育与培训:教师或教育机构可制作教学短视频。

Github:https://github.com/gyoridavid/short-video-make


收藏
最新工具
XiaomiROM
XiaomiROM

一个能下载小米手机、平板等设备官方系统固件的网站,收集了国行、全...

CPS check
CPS check

一人测试用户点击速度(CPS,即每秒点击次数) 的在线网站,可在...

中国庭审公开网
中国庭审公开网

全国法院的庭审直播平台,能看各类案件庭审直播和回放,还能按不同条...

GradientHunt
GradientHunt

一个免费的色彩灵感平台,提供大量手工制作的时尚渐变色,目标是成为...

特工宇宙
特工宇宙

国内首个专注于Agent的科技媒体,由杭州电子科技大学00后毕业...

面灵AI
面灵AI

一款面试辅助工具,能实时分析面试问题并给出专业建议,支持多语言面...

Teleprompter Online
Teleprompter Online

一款免费的在线提词器网页应用,能在PC或Mac的现代网页浏览器上...

Gallerix
Gallerix

也叫“巨人网上博物馆”,是个专注艺术的互联网博物馆,Galler...

快手Kwali
快手Kwali

磁力引擎旗下磁力开创平台推出的AI视频I创作工具,输入自然语言指...

磁力开创
磁力开创

快手磁力引擎推出的一站式视频创意生产平台,结合智能化功能和简化流...