NarratoAI 使用教程

📖 项目简介

NarratoAI 是一款一站式 AI 影视解说 + 自动化剪辑工具。基于大语言模型（LLM）和视觉多模态模型，实现从「看懂视频 → 写解说文案 → 自动剪辑 → 配音 → 加字幕」的一站式流水线，让你用几分钟产出一条成片。

NarratoAI 目前支持三大玩法：影视解说、短剧解说、短剧混剪。无论是电影电视剧解说号，还是短剧混剪批量起号，都能用一套工具搞定。

💡

GitHub 地址： https://github.com/linyqh/NarratoAI （8.9K Star · Python · 完全免费开源）

⚠️

声明：项目仅供学习和研究使用，不得商用。解说素材请使用自有版权或获授权的内容。

✨ 核心亮点

🧠

多模态理解视频

Gemini / Qwen2-VL 抽帧看懂剧情

✍️

一键生成解说文案

DeepSeek R1/V3、GPT、Claude 任选

✂️

自动剪辑配音字幕

MoviePy 驱动，卡点精准对齐

🎞️

短剧混剪批量起号

合并素材 / 一键转录 / 清理缓存

📦

支持导出剪映草稿

剪完二次精修无压力

🆓

完全开源免费

MacOS Docker / Windows 整合包

🖥️ 环境要求

操作系统：Windows 10/11 或 macOS 11.0 以上
CPU：建议 4 核或以上
内存：建议 8 GB 或以上
显卡：非必须（调用云端大模型即可）
Python：3.12+（本地部署需要）
LLM API Key：至少准备一个（DeepSeek / Gemini / OpenAI / 硅基流动 / 302.AI 等任选）

🚀 三种安装方式

方式一：Windows 整合包（推荐）

关注微信公众号 NarratoAI 助手，在右下角菜单栏可获取 Windows 整合包下载链接，解压即用。

方式二：macOS Docker 部署（推荐）

                bash
                # 1. 克隆项目
git clone https://github.com/linyqh/NarratoAI.git
cd NarratoAI

# 2. 一键部署
docker compose up -d

# 3. 浏览器打开
# http://localhost:8501
            

方式三：本地运行（全平台）

                bash
                # 1. 克隆项目
git clone https://github.com/linyqh/NarratoAI.git
cd NarratoAI

# 2. 安装依赖（建议先创建 venv / conda 环境）
pip install -r requirements.txt

# 3. 复制配置文件
cp config.example.toml config.toml

# 4. 编辑 config.toml，填入你的 LLM / TTS API 密钥

# 5. 启动 WebUI（放大上传上限以便处理大视频）
streamlit run webui.py --server.maxUploadSize=2048

# 6. 浏览器打开 http://localhost:8501
            

🎬 使用流程

选择工作模式

在 WebUI 页面顶部切换：影视解说 / 短剧解说 / 短剧混剪。解说用于单部电影电视剧成片，混剪用于短剧批量起号。

上传素材 + 配置模型

上传影视视频（支持 mp4 / mkv 等常见格式），选择视觉模型（Gemini / Qwen2-VL）和文本模型（DeepSeek / GPT / Claude），填入对应 API Key。

一键分析 + 生成解说文案

点击「开始分析」，系统会自动抽帧、打标、理解剧情，然后调用 LLM 生成解说文案。你可以在页面中直接编辑文案，或者让 AI 按目标风格重写。

配置 TTS 配音

内置 Edge TTS / Azure TTS / 腾讯云 TTS / IndexTTS2 语音克隆等多种引擎，选择一个喜欢的音色试听即可。

自动剪辑合成成片

点击「开始合成」，NarratoAI 会按文案卡点剪辑、拼接镜头、贴字幕、配 BGM，最终输出 mp4 成片；也可以选择导出剪映草稿二次精修。

短剧混剪批量模式

混剪模式支持一键合并多集素材、批量转录、批量生成文案、一键清理缓存，适合短剧号批量起号，一天产出 10-30 条不是梦。

💰 推荐 API 配额（羊毛福利）

硅基流动：注册送 2000 万 Token（约 16 元配额），剪 10 分钟视频约 0.1 元，邀请码 MI9PgHwB。
302.AI：企业级 AI 资源中心，一次接入上百种模型，注册送 1 美元体验金。
DeepSeek：国内主流大模型，0.5 版价格低，适合短剧混剪批量跑文案。
Gemini：Google 视觉多模态能力强，推荐用于影视解说的剧情理解环节。

❓ 常见问题

Q: Windows 提示缺少 ffmpeg / moviepy 报错？

确保已经安装 ffmpeg 并添加到系统 PATH；Python 环境下执行 pip install moviepy --upgrade 重装 moviepy 即可。整合包版本已内置依赖，无需额外处理。

Q: 生成的文案不够"爆款"、太平淡？

在 WebUI 文案生成界面可自定义 Prompt 模板，指定风格（如"东北老铁解说风"、"反差剧透风"），或者切换到 DeepSeek R1 这类推理模型获得更有张力的文案。

Q: 配音声音机械、不像真人？

推荐启用 IndexTTS2 语音克隆，上传一段 10-30 秒的真人原声，即可克隆出高度拟真的音色；或切换到腾讯云 / Azure 的主播级 TTS。

Q: 一键运行失败、502 / 超时？

多半是 LLM API 调用超限或网络问题。建议：①更换 API Key 或切换到硅基流动/302.AI 这类聚合平台；②减少单次处理的视频长度分批跑；③查看终端日志定位具体失败步骤。

Q: 可以商用吗？

项目本身仅供学习和研究使用，不得商用。如需商业授权，请联系 NarratoAI 作者。发布到平台的成片需要自行把控素材版权合规问题。

🛡️ 避坑提醒

⚠️

谨防付费盗卖：NarratoAI 官方完全免费，近期在抖音、B 站等平台有人改名倒卖，遇到"付费下载 NarratoAI"一律不要上当。认准官方渠道：GitHub 原仓库、微信公众号「NarratoAI 助手」。