Open-AutoGLM 安装使用教程

智谱AI开源的手机自动化智能体,一句话操控50+应用

⭐ 23K Star · MIT开源

🚀 项目介绍

Open-AutoGLM 是智谱AI于2024年10月推出、2025年12月正式完整开源的手机操作智能体框架。这是一个经历32个月酝酿的"Phone Use"解决方案,标志着手机AI Agent从"黑箱垄断"走向"全民共创"的转折点。

核心优势:一句话自然语言指令 → AI自动操控手机 → 完成复杂任务,全程免手动!

项目信息 详情
GitHub 地址 github.com/THUDM/OpenAutoGLM
开发团队 智谱AI (THUDM)
Star 数量 23K+
开源协议 MIT + Apache 双许可证(可商用)
核心模型 AutoGLM-Phone-9B(90亿参数视觉语言模型)

核心功能

🗣️

自然语言控制

一句话指令即可完成复杂操作,如"帮我在美团点一杯冰豆花"

👁️

多模态理解

一次接收10张截图,25K上下文,精准理解屏幕内容

🎯

毫米级精度

通过ADB实现精确点击、滑动、输入操作

🛡️

智能容错

内置弹窗、广告、弱网容错机制,稳定可靠

典型使用场景

💡

Open-AutoGLM 可以完成任何你在手机上能做的操作,只需要用自然语言描述你的需求!

📱 支持应用(50+)

💬 社交通讯

微信、QQ、微博、飞书、企业微信

🛒 电商购物

淘宝、京东、拼多多、唯品会、得物、闲鱼

🍜 美食外卖

美团、美团外卖、大众点评、海底捞

✈️ 出行旅游

12306、滴滴出行、同程旅行、高德地图、百度地图

🎬 视频娱乐

bilibili、抖音、快手、腾讯视频、爱奇艺、芒果TV

🎵 音乐音频

QQ音乐、汽水音乐、喜马拉雅

🏠 生活服务

小红书、知乎、今日头条、58同城、中国移动

🤖 AI与工具

豆包、WPS、UC浏览器、扫描全能王、美图秀秀

⚙️ 系统应用

浏览器、日历、相机、时钟、文件管理器、相册、联系人、短信、设置等

📦 华为服务

应用市场、音乐、视频、阅读、主题、天气

📋 环境要求

要求 说明
操作系统 Windows / macOS / Linux
Python 3.8 或更高版本
Android 设备 Android 8.0+,需开启开发者模式和USB调试
ADB 工具 Android Debug Bridge(SDK Platform Tools)
GPU(可选) 本地部署需要 24GB+ 显存,或使用 API 调用
⚠️

注意:如果没有高端GPU,可以使用云端API模式,无需本地部署模型!

⚙️ 安装步骤

1

安装 ADB 工具

下载 Android SDK Platform Tools:

链接
# Windows / macOS / Linux
https://developer.android.com/studio/releases/platform-tools

# 解压后将目录添加到系统 PATH 环境变量
# 验证安装
adb version
2

克隆代码仓库

bash
git clone https://github.com/THUDM/OpenAutoGLM.git
cd OpenAutoGLM
3

创建虚拟环境并安装依赖

bash
# 创建虚拟环境
python -m venv venv

# 激活虚拟环境
# Windows:
venv\Scripts\activate
# macOS/Linux:
source venv/bin/activate

# 安装依赖
pip install -r requirements.txt
4

连接 Android 设备

bash
# 手机开启开发者模式和USB调试
# 用数据线连接电脑

# 验证连接
adb devices

# 应该看到类似输出:
# List of devices attached
# XXXXX   device
5

配置 API Key(云端模式)

.env
# 复制配置文件
cp .env.example .env

# 编辑 .env 文件,填入智谱AI API Key
ZHIPU_API_KEY=your_api_key_here

# 获取 API Key: https://open.bigmodel.cn/
6

启动服务

bash
# 启动 Open-AutoGLM
python main.py

# 或使用 WebUI 界面
python webui.py

💻 使用方法

命令行模式

示例
# 启动后输入自然语言指令
>>> 帮我在美团点一杯冰豆花

# AI会自动:
# 1. 打开美团APP
# 2. 搜索"冰豆花"
# 3. 选择商家
# 4. 加入购物车
# 5. 确认下单

更多指令示例

示例
# 购物比价
>>> 帮我在淘宝和京东比价 iPhone 16 Pro Max

# 订票出行
>>> 帮我订明天上午北京到上海的高铁票

# 餐厅预订
>>> 帮我在大众点评预订今晚7点的海底捞

# 发送消息
>>> 帮我在微信给张三发一条消息:明天见

# 播放音乐
>>> 帮我在QQ音乐播放周杰伦的歌
🎯

使用技巧:指令越具体越好!比如"帮我点外卖"不如"帮我在美团点一份黄焖鸡米饭,送到XX地址"效果好。

常见问题

Q1: 和豆包手机有什么区别?

Open-AutoGLM 是完全开源的方案,可以自行部署和定制。豆包手机是商业产品,开箱即用但不开源。Open-AutoGLM 可以作为豆包手机的平替方案。

Q2: 需要 ROOT 手机吗?

不需要!Open-AutoGLM 通过 ADB(Android Debug Bridge)控制手机,只需要开启开发者模式和USB调试即可。

Q3: 支持 iOS 吗?

目前仅支持 Android 设备。iOS 因系统限制,无法通过 ADB 控制。

Q4: 本地部署需要什么配置?

本地部署 AutoGLM-Phone-9B 模型需要:

如果配置不够,可以使用云端 API 模式。

Q5: WiFi 远程控制可以吗?

可以!除了 USB 有线连接,还支持 WiFi ADB 无线调试:

bash
# 先用USB连接,开启无线调试
adb tcpip 5555

# 断开USB,用WiFi连接
adb connect 192.168.1.100:5555

Q6: 安全吗?会泄露隐私吗?

Open-AutoGLM 提供三种隐私保护模式:

Q7: 可以商用吗?

可以!Open-AutoGLM 采用 MIT + Apache 双许可证,代码可商用且可闭改。但请注意遵守相关法律法规。