Stable Virtual Camera:使用一张图片,可以生成360度旋转的3D视频

Stable Virtual Camera是什么?

Stable Virtual Camera 是由 Stability AI 推出的一款用于NVS 的多视角扩散模型。它能够根据任意数量的输入视角及其对应的相机参数,生成目标相机视角下的新图像。当所有相机形成一条轨迹时,生成的视角在 3D 上具有一致性、时间上平滑,并且正如其名称所暗示的那样——“稳定”,能够生成无缝的轨迹视频

Stable Virtual Camera:使用一张图片,可以生成360度旋转的3D视频.webp

Stable Virtual Camera功能

  • 多视角输入:可以接受从 1 到 32 张输入图像,性能随着输入视角的增加而提升,尤其是在处理大型场景时。

  • 灵活的图像分辨率:尽管模型仅在 576×576 的正方形图像上进行训练,但能够以零样本的方式生成不同宽高比的目标视角。

  • 长视频生成与闭环一致性:能够生成长达 1000 帧的视频,并在相机返回到同一位置时保持 3D 一致性。

  • 采样多样性:在给定稀疏输入视角时,能够捕捉视角合成的不确定性,并生成不同的可能场景。

  • 基准测试:建立了一个全面的基准,用于在不同数据集和设置下评估 NVS 方法。Stable Virtual Camera 达到了新的最佳性能。

Stable Virtual Camera应用

  • 广告和营销:快速生成吸引人的产品展示视频。

  • 内容创作:帮助艺术家和设计师将静态图像转化为动态视频。

  • 教育和培训:将教材中的静态插图转化为 3D 视频,增强学习体验。

  • 数字电影和 3D 动画:为影视制作提供新的可能性。

Stable Virtual Camera使用方法

1. 获取代码和模型

  • 代码:从 GitHub 克隆代码。链接见文章末尾。

  • 模型权重:从 Hugging Face 下载模型文件。下载链接见文章末尾。

2. 安装依赖

运行以下命令安装所需依赖:

pip install -r requirements.txt

3. 运行方式

  • 交互式使用(Gradio 演示)

启动 Gradio 演示:

python gradio_demo.py

通过图形界面上传图片并设置参数,生成 3D 视频。

  • 命令行使用(CLI)

使用命令行运行:

python demo.py --data_path  --output_path  --camera_path

示例:

python demo.py --data_path ./input_images --output_path ./output_video --camera_path spiral

4. 输入和输出

  • 输入:支持 1 到 32 张 2D 图像,需提供相机参数。

  • 输出:生成不同宽高比(如 1:1、9:16、16:9)的 3D 视频,支持长达 1000 帧。

GitHub 代码仓库:https://github.com/Stability-ai/stable-virtual-camera

Hugging Face 模型页面:https://huggingface.co/stabilityai/stable-virtual-camera

项目主页:https://stable-virtual-camera.github.io/

论文:https://arxiv.org/abs/2503.14489

收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...