Pixelle-Video 使用教程

AI 全自动短视频引擎 · 输入一句话,自动出片

⭐ 6.5K Star · 开源免费

📖 项目简介

Pixelle-Video 是一个 AI 全自动短视频生成引擎,只需输入一个主题,就能自动完成视频文案撰写、AI 配图/视频生成、语音合成、背景音乐添加和一键视频合成。零门槛、零剪辑经验,让视频创作变成一句话的事!

核心亮点

✍️
AI 智能文案
根据主题自动创作解说词,无需自己写脚本
🎨
AI 生成配图
每句话自动配上精美 AI 插图,支持 FLUX 等模型
🗣️
AI 合成语音
支持 Edge-TTS、Index-TTS 等多种方案,可克隆音色
🎵
背景音乐
内置多首 BGM,也支持自定义上传音乐
🔧
ComfyUI 架构
基于 ComfyUI 工作流,可灵活替换任意模块
🤖
多模型支持
支持 GPT、通义千问、DeepSeek、Ollama 等

💻 环境要求

Windows 用户推荐使用一键整合包,无需安装 Python/uv/FFmpeg,开箱即用!

🚀 安装步骤

方式一:Windows 一键整合包(推荐)

1

下载整合包

前往 GitHub Releases 页面下载最新的 Windows 一键整合包并解压。

2

启动服务

双击运行 start.bat,浏览器自动打开 http://localhost:8501

3

配置 API

展开「⚙️ 系统配置」面板,配置 LLM API Key 和图像生成服务即可开始使用。

方式二:从源码安装

1

克隆项目

bash git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
2

安装依赖并启动

bash uv run streamlit run web/app.py

使用 uv 运行会自动安装所有依赖,浏览器自动打开 Web 界面。

3

配置系统参数

展开「⚙️ 系统配置」面板:

  • LLM 配置:选择预设模型(通义千问、GPT-4o、DeepSeek等),填入 API Key
  • 图像配置:填写 ComfyUI 本地地址或 RunningHub API Key

🎯 使用方法

1

选择生成模式

「AI 生成内容」输入主题让 AI 自动创作,或「固定文案内容」直接粘贴现成文案。

2

设置语音和视觉

选择 TTS 工作流和语音音色,选择视频模板和图像生成风格。支持上传参考音频进行声音克隆。

3

一键生成视频

点击「🎬 生成视频」按钮,等待几分钟即可获得成品视频。支持竖屏、横屏等多种尺寸。

⚠️
费用说明:本地部署 ComfyUI + Ollama 可实现完全免费运行;推荐使用通义千问(成本极低)+ ComfyUI 本地部署的组合方案。

常见问题

Q: 第一次使用需要多久?

生成时长取决于视频分镜数量、网络状况和 AI 推理速度,通常几分钟内即可完成一条短视频。

Q: 视频效果不满意怎么办?

可以尝试更换 LLM 模型(不同模型文案风格不同)、调整图像提示词前缀(改变配图风格)、更换 TTS 工作流或上传参考音频(改变语音效果)、尝试不同的视频模板。

Q: 支持哪些 AI 模型?

LLM 支持 GPT、通义千问、DeepSeek、Ollama 等;图像生成支持 ComfyUI 内的所有模型(FLUX、SDXL 等);TTS 支持 Edge-TTS、Index-TTS 等。

Q: 可以完全免费使用吗?

可以!LLM 使用 Ollama 本地运行 + ComfyUI 本地部署,即可 0 元使用全部功能。