NarratoAI 使用教程

8.9K Star · AI 影视解说 + 短剧混剪神器

⭐ 开源免费 · 一键解说剪辑

📖 项目简介

NarratoAI 是一款一站式 AI 影视解说 + 自动化剪辑工具。基于大语言模型(LLM)和视觉多模态模型, 实现从「看懂视频 → 写解说文案 → 自动剪辑 → 配音 → 加字幕」的一站式流水线,让你用几分钟产出一条成片。

NarratoAI 目前支持三大玩法:影视解说、短剧解说、短剧混剪。无论是电影电视剧解说号,还是短剧混剪批量起号,都能用一套工具搞定。

💡
GitHub 地址: https://github.com/linyqh/NarratoAI (8.9K Star · Python · 完全免费开源)
⚠️
声明:项目仅供学习和研究使用,不得商用。解说素材请使用自有版权或获授权的内容。

核心亮点

🧠
多模态理解视频
Gemini / Qwen2-VL 抽帧看懂剧情
✍️
一键生成解说文案
DeepSeek R1/V3、GPT、Claude 任选
✂️
自动剪辑配音字幕
MoviePy 驱动,卡点精准对齐
🎞️
短剧混剪批量起号
合并素材 / 一键转录 / 清理缓存
📦
支持导出剪映草稿
剪完二次精修无压力
🆓
完全开源免费
MacOS Docker / Windows 整合包

🖥️ 环境要求

🚀 三种安装方式

方式一:Windows 整合包(推荐)

关注微信公众号 NarratoAI 助手,在右下角菜单栏可获取 Windows 整合包下载链接,解压即用。

方式二:macOS Docker 部署(推荐)

bash # 1. 克隆项目 git clone https://github.com/linyqh/NarratoAI.git cd NarratoAI # 2. 一键部署 docker compose up -d # 3. 浏览器打开 # http://localhost:8501

方式三:本地运行(全平台)

bash # 1. 克隆项目 git clone https://github.com/linyqh/NarratoAI.git cd NarratoAI # 2. 安装依赖(建议先创建 venv / conda 环境) pip install -r requirements.txt # 3. 复制配置文件 cp config.example.toml config.toml # 4. 编辑 config.toml,填入你的 LLM / TTS API 密钥 # 5. 启动 WebUI(放大上传上限以便处理大视频) streamlit run webui.py --server.maxUploadSize=2048 # 6. 浏览器打开 http://localhost:8501

🎬 使用流程

1

选择工作模式

在 WebUI 页面顶部切换:影视解说 / 短剧解说 / 短剧混剪。解说用于单部电影电视剧成片,混剪用于短剧批量起号。

2

上传素材 + 配置模型

上传影视视频(支持 mp4 / mkv 等常见格式),选择视觉模型(Gemini / Qwen2-VL)和文本模型(DeepSeek / GPT / Claude),填入对应 API Key。

3

一键分析 + 生成解说文案

点击「开始分析」,系统会自动抽帧、打标、理解剧情,然后调用 LLM 生成解说文案。你可以在页面中直接编辑文案,或者让 AI 按目标风格重写。

4

配置 TTS 配音

内置 Edge TTS / Azure TTS / 腾讯云 TTS / IndexTTS2 语音克隆等多种引擎,选择一个喜欢的音色试听即可。

5

自动剪辑合成成片

点击「开始合成」,NarratoAI 会按文案卡点剪辑、拼接镜头、贴字幕、配 BGM,最终输出 mp4 成片;也可以选择导出剪映草稿二次精修。

6

短剧混剪批量模式

混剪模式支持一键合并多集素材、批量转录、批量生成文案、一键清理缓存,适合短剧号批量起号,一天产出 10-30 条不是梦。

💰 推荐 API 配额(羊毛福利)

常见问题

Q: Windows 提示缺少 ffmpeg / moviepy 报错?

确保已经安装 ffmpeg 并添加到系统 PATH;Python 环境下执行 pip install moviepy --upgrade 重装 moviepy 即可。整合包版本已内置依赖,无需额外处理。

Q: 生成的文案不够"爆款"、太平淡?

在 WebUI 文案生成界面可自定义 Prompt 模板,指定风格(如"东北老铁解说风"、"反差剧透风"),或者切换到 DeepSeek R1 这类推理模型获得更有张力的文案。

Q: 配音声音机械、不像真人?

推荐启用 IndexTTS2 语音克隆,上传一段 10-30 秒的真人原声,即可克隆出高度拟真的音色;或切换到腾讯云 / Azure 的主播级 TTS。

Q: 一键运行失败、502 / 超时?

多半是 LLM API 调用超限或网络问题。建议:①更换 API Key 或切换到硅基流动/302.AI 这类聚合平台;②减少单次处理的视频长度分批跑;③查看终端日志定位具体失败步骤。

Q: 可以商用吗?

项目本身仅供学习和研究使用,不得商用。如需商业授权,请联系 NarratoAI 作者。发布到平台的成片需要自行把控素材版权合规问题。

🛡️ 避坑提醒

⚠️
谨防付费盗卖:NarratoAI 官方完全免费,近期在抖音、B 站等平台有人改名倒卖,遇到"付费下载 NarratoAI"一律不要上当。 认准官方渠道:GitHub 原仓库、微信公众号「NarratoAI 助手」。