85K Star · AI 浏览器自动化代理 · 让 AI 帮你操作浏览器
⭐ 85K Star · 开源免费Browser Use 是一个开源的 AI 浏览器自动化代理,能让 AI 通过自然语言控制浏览器,自动完成填表、购物、搜索、数据提取等各种网页操作。无需编写复杂的爬虫或自动化脚本,只需用一句话告诉 AI 你想做什么,它就能自动完成。
支持多种主流大语言模型(OpenAI、Anthropic、Google Gemini 等),基于 Playwright 实现浏览器控制,GitHub 上已获得 85K+ Star。
uv 作为包管理器,速度更快。使用 uv 创建项目环境并安装依赖:
uv init && uv add browser-use && uv sync
如果系统没有 Chromium 浏览器,运行以下命令安装:
uvx browser-use install
在项目根目录创建 .env 文件,填入你的 API Key:
# 选择一个 LLM 提供商即可
BROWSER_USE_API_KEY=your-browser-use-key
# OPENAI_API_KEY=your-openai-key
# ANTHROPIC_API_KEY=your-anthropic-key
# GOOGLE_API_KEY=your-google-key
创建 main.py 文件:
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="帮我搜索今天的天气预报",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())
在终端运行你的脚本:
uv run main.py
AI 将自动打开浏览器,完成你指定的任务!
你可以给 Agent 添加自定义工具,扩展它的能力:
from browser_use import Tools
tools = Tools()
@tools.action(description='保存搜索结果到文件')
def save_result(content: str) -> str:
with open('result.txt', 'w') as f:
f.write(content)
return "已保存"
agent = Agent(
task="搜索并保存结果",
llm=llm,
browser=browser,
tools=tools,
)
Browser Use 还提供了快速的命令行模式:
browser-use open https://example.com # 打开网页
browser-use state # 查看可点击元素
browser-use click 5 # 点击第5个元素
browser-use type "Hello" # 输入文字
browser-use screenshot page.png # 截图
支持几乎所有主流 LLM:OpenAI(GPT-4o 等)、Anthropic(Claude)、Google(Gemini)、以及 Browser Use 自家优化的 ChatBrowserUse 模型。还可以通过 Ollama 使用本地模型。
Browser Use 库本身完全开源免费(MIT 协议)。但你需要自备 LLM API Key(如 OpenAI Key),会产生 Token 调用费用。Browser Use Cloud 提供付费的云端浏览器服务。
本地开源版本需要配合更好的浏览器指纹和代理才能绕过验证码。推荐使用 Browser Use Cloud 服务,内置反检测浏览器和验证码解决方案。
可以复用本机 Chrome 浏览器配置文件(Profile),已登录的网站无需重新登录。详见官方文档的 Authentication 章节。