short-video-maker:一个开源的自动化短视频创作工具

short-video-maker是什么?

short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。

short-video-maker:一个开源的自动化短视频创作工具.webp

short-video-maker功能

  • 从文本提示生成完整的短视频。

  • 文字转语音。

  • 自动字幕生成和样式设计。

  • 通过Pexels搜索和选择背景视频。

  • 背景音乐支持,可选择流派/情绪。

  • 提供REST API和模型上下文协议(MCP)服务器。

short-video-maker工作原理

  • 使用Kokoro TTS将文本转换为语音。

  • 使用Whisper生成准确的字幕。

  • 从Pexels查找相关的背景视频。

  • 使用Remotion组合所有元素。

  • 渲染出专业外观的短视频,字幕时间精准。

运行

使用NPX(推荐)

支持GPU的运行方式:

LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
需要安装Node.js环境,并通过npx命令快速启动。

使用Docker

CPU版本:

docker run -it --rm --name short-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= \
  gyoridavid/short-video-maker:latest

NVIDIA GPU版本:

docker run -it --rm --name shorts-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= --gpus=all \
  gyoridavid/short-video-maker:latest-cuda

环境变量

  • PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。

  • PORT:API/MCP服务器的端口,默认为3123。

  • LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。

  • WHISPER_VERBOSE:Whisper的详细模式,默认为false。

示例

示例JSON输入:

{
  "scenes": [
    {
      "text": "Hello world! Enjoy using this tool to create awesome ai workflows",
      "searchTerms": ["rainbow"]
    }
  ],
  "config": {
    "paddingBack": 1500,
    "music": "happy"
  }
}

输出为hello_world.mp4文件。

short-video-maker应用

  • 社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。

  • 教育领域:制作课程预告、学习资源或语言学习视频。

  • 新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。

  • 商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。

  • 教育与培训:教师或教育机构可制作教学短视频。

Github:https://github.com/gyoridavid/short-video-make


收藏
最新工具
Adobe Express
Adobe Express

Adobe推出的一站式设计工具,整合了图像、视频、文档/PDF、...

Intangible AI
Intangible AI

创意行业空间智能AI平台,通过简洁的3D界面与空间智能技术解决A...

法大大iTerms
法大大iTerms

法大大推出的一站式法律AI工作台,基于自研法律大模型的AI智能体...

Relume
Relume

一个通过AI来优化网站设计与搭建流程的平台,可以快速生成网站地图...

Pomelli
Pomelli

Google开发的AI营销工具,主要服务中小商家。你只需要提供企...

Gartic.io
Gartic.io

一个很受欢迎的在线绘画猜词游戏。它把经典的“你画我猜”玩法和多人...

LandPPT
LandPPT

一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自...

AppleWalls
AppleWalls

一个免费提供苹果官方内置壁纸下载的网站,包括iPhone、iPa...

Coddy.Tech
Coddy.Tech

一个免费、有趣且实用的编程学习平台。支持学习包括 Python、...

森林电台Tree.FM
森林电台Tree.FM

一个能让你收听世界各地森林声音的网站。通过随机收听功能,你可以沉...