PixelleVideo 使用教程

📖 项目简介

Pixelle-Video 是一个 AI 全自动短视频生成引擎，只需输入一个主题，就能自动完成视频文案撰写、AI 配图/视频生成、语音合成、背景音乐添加和一键视频合成。零门槛、零剪辑经验，让视频创作变成一句话的事！

💡

GitHub 地址： https://github.com/AIDC-AI/Pixelle-Video

✨ 核心亮点

✍️

AI 智能文案

根据主题自动创作解说词，无需自己写脚本

🎨

AI 生成配图

每句话自动配上精美 AI 插图，支持 FLUX 等模型

🗣️

AI 合成语音

支持 Edge-TTS、Index-TTS 等多种方案，可克隆音色

🎵

背景音乐

内置多首 BGM，也支持自定义上传音乐

🔧

ComfyUI 架构

基于 ComfyUI 工作流，可灵活替换任意模块

🤖

多模型支持

支持 GPT、通义千问、DeepSeek、Ollama 等

💻 环境要求

Python 3.10+（推荐使用 uv 包管理器）
FFmpeg（视频处理必备）
LLM API Key（通义千问、GPT、DeepSeek 等任选其一）
图像生成服务（ComfyUI 本地部署或 RunningHub 云端）

✅

Windows 用户推荐使用一键整合包，无需安装 Python/uv/FFmpeg，开箱即用！

🚀 安装步骤

方式一：Windows 一键整合包（推荐）

下载整合包

前往 GitHub Releases 页面下载最新的 Windows 一键整合包并解压。

启动服务

双击运行 start.bat，浏览器自动打开 http://localhost:8501。

配置 API

展开「⚙️ 系统配置」面板，配置 LLM API Key 和图像生成服务即可开始使用。

方式二：从源码安装

克隆项目

                        bash
                        git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
                    

安装依赖并启动

                        bash
                        uv run streamlit run web/app.py
                    

使用 uv 运行会自动安装所有依赖，浏览器自动打开 Web 界面。

配置系统参数

展开「⚙️ 系统配置」面板：

LLM 配置：选择预设模型（通义千问、GPT-4o、DeepSeek等），填入 API Key
图像配置：填写 ComfyUI 本地地址或 RunningHub API Key

🎯 使用方法

选择生成模式

「AI 生成内容」输入主题让 AI 自动创作，或「固定文案内容」直接粘贴现成文案。

设置语音和视觉

选择 TTS 工作流和语音音色，选择视频模板和图像生成风格。支持上传参考音频进行声音克隆。

一键生成视频

点击「🎬 生成视频」按钮，等待几分钟即可获得成品视频。支持竖屏、横屏等多种尺寸。

⚠️

费用说明：本地部署 ComfyUI + Ollama 可实现完全免费运行；推荐使用通义千问（成本极低）+ ComfyUI 本地部署的组合方案。

❓ 常见问题

Q: 第一次使用需要多久？

生成时长取决于视频分镜数量、网络状况和 AI 推理速度，通常几分钟内即可完成一条短视频。

Q: 视频效果不满意怎么办？

可以尝试更换 LLM 模型（不同模型文案风格不同）、调整图像提示词前缀（改变配图风格）、更换 TTS 工作流或上传参考音频（改变语音效果）、尝试不同的视频模板。

Q: 支持哪些 AI 模型？

LLM 支持 GPT、通义千问、DeepSeek、Ollama 等；图像生成支持 ComfyUI 内的所有模型（FLUX、SDXL 等）；TTS 支持 Edge-TTS、Index-TTS 等。

Q: 可以完全免费使用吗？

可以！LLM 使用 Ollama 本地运行 + ComfyUI 本地部署，即可 0 元使用全部功能。