Browser Use 安装使用教程

85K Star · AI 浏览器自动化代理 · 让 AI 帮你操作浏览器

⭐ 85K Star · 开源免费

📖 项目简介

Browser Use 是一个开源的 AI 浏览器自动化代理,能让 AI 通过自然语言控制浏览器,自动完成填表、购物、搜索、数据提取等各种网页操作。无需编写复杂的爬虫或自动化脚本,只需用一句话告诉 AI 你想做什么,它就能自动完成。

支持多种主流大语言模型(OpenAI、Anthropic、Google Gemini 等),基于 Playwright 实现浏览器控制,GitHub 上已获得 85K+ Star

核心亮点

💬
自然语言控制
用普通话描述任务,AI 自动操作浏览器完成
🤖
多模型支持
支持 OpenAI、Anthropic、Google Gemini 等主流大模型
🛡️
隐身浏览器
自带反检测、验证码处理、代理轮换功能
🆓
开源免费
MIT 开源协议,85K Star,社区活跃

⚙️ 环境要求

⚠️
确保 Python 版本 >= 3.11,旧版本不支持。推荐使用 uv 作为包管理器,速度更快。

🚀 安装步骤

1

创建项目并安装 Browser Use

使用 uv 创建项目环境并安装依赖:

bash uv init && uv add browser-use && uv sync

如果系统没有 Chromium 浏览器,运行以下命令安装:

bash uvx browser-use install
2

配置 API Key

在项目根目录创建 .env 文件,填入你的 API Key:

.env # 选择一个 LLM 提供商即可
BROWSER_USE_API_KEY=your-browser-use-key
# OPENAI_API_KEY=your-openai-key
# ANTHROPIC_API_KEY=your-anthropic-key
# GOOGLE_API_KEY=your-google-key
3

编写你的第一个 AI 浏览器脚本

创建 main.py 文件:

python from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()
    agent = Agent(
        task="帮我搜索今天的天气预报",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

if __name__ == "__main__":
    asyncio.run(main())
4

运行脚本

在终端运行你的脚本:

bash uv run main.py

AI 将自动打开浏览器,完成你指定的任务!

🎮 更多玩法

自定义工具

你可以给 Agent 添加自定义工具,扩展它的能力:

python from browser_use import Tools

tools = Tools()

@tools.action(description='保存搜索结果到文件')
def save_result(content: str) -> str:
    with open('result.txt', 'w') as f:
        f.write(content)
    return "已保存"

agent = Agent(
    task="搜索并保存结果",
    llm=llm,
    browser=browser,
    tools=tools,
)

CLI 命令行模式

Browser Use 还提供了快速的命令行模式:

bash browser-use open https://example.com # 打开网页
browser-use state # 查看可点击元素
browser-use click 5 # 点击第5个元素
browser-use type "Hello" # 输入文字
browser-use screenshot page.png # 截图
提示:CLI 模式会在命令之间保持浏览器运行,适合快速调试和交互式操作。

常见问题

Q: 支持哪些大语言模型?

支持几乎所有主流 LLM:OpenAI(GPT-4o 等)、Anthropic(Claude)、Google(Gemini)、以及 Browser Use 自家优化的 ChatBrowserUse 模型。还可以通过 Ollama 使用本地模型。

Q: 是否完全免费?

Browser Use 库本身完全开源免费(MIT 协议)。但你需要自备 LLM API Key(如 OpenAI Key),会产生 Token 调用费用。Browser Use Cloud 提供付费的云端浏览器服务。

Q: 如何处理网站验证码(CAPTCHA)?

本地开源版本需要配合更好的浏览器指纹和代理才能绕过验证码。推荐使用 Browser Use Cloud 服务,内置反检测浏览器和验证码解决方案。

Q: 如何保持登录状态?

可以复用本机 Chrome 浏览器配置文件(Profile),已登录的网站无需重新登录。详见官方文档的 Authentication 章节。