你是否想让你的大型语言模型(LLM)应用,如 Claude,能够像人一样浏览网页、与之互动,并保持登录状态?Browserbase MCP 服务器就是实现这一目标的利器。它基于模型上下文协议(MCP),将强大的 Browserbase 浏览器自动化服务与你的 LLM 无缝集成。
核心功能介绍
Browserbase MCP 服务器赋予了 LLM 以下关键能力:
- 网页浏览与交互: LLM 可以通过 Browserbase 打开网页、点击链接、填写表单、提取信息,执行复杂的网页操作任务。
- 持久化会话(Contexts): 利用 Browserbase 的 Contexts 功能,可以保存浏览器的 Cookie、认证信息和缓存数据。这意味着 LLM 可以在多次会话中保持登录状态,避免重复登录,提高效率,甚至减少遇到验证码的几率。
- 精细化 Cookie 管理: 服务器提供了直接添加、获取和删除浏览器 Cookie 的工具,方便进行登录状态管理、调试或备份恢复。
- 代理支持: 可以启用 Browserbase 的代理功能,满足特定的网络访问需求。
- 自定义浏览器视窗: 可以调整浏览器会话的视口大小,以适应不同的网页布局或测试需求。
如何开始使用?
将 Browserbase MCP 服务器集成到你的 MCP 客户端非常简单。
推荐方式:使用 NPM 包
这是最便捷的方式。只需在你的 MCP 配置文件(通常是 JSON 格式)中添加以下服务器配置:
{
"mcpServers": {
"browserbase": {
"command": "npx",
"args" : ["@browserbasehq/mcp"],
"env": {
"BROWSERBASE_API_KEY": "YOUR_BROWSERBASE_API_KEY", // 替换为你的 API Key
"BROWSERBASE_PROJECT_ID": "YOUR_BROWSERBASE_PROJECT_ID" // 替换为你的 Project ID
}
}
}
}
将 YOUR_BROWSERBASE_API_KEY
和 YOUR_BROWSERBASE_PROJECT_ID
替换为你从 Browserbase 获取的实际凭证。然后重新加载你的 MCP 客户端即可。
本地运行方式
如果你希望完全在本地运行:
- 克隆仓库:
bash git clone https://github.com/browserbase/mcp-server-browserbase.git
- 安装依赖并构建:
bash cd mcp-server-browserbase/browserbase npm install && npm run build
- 配置 MCP 客户端:
- 使用 STDIO(标准输入输出): 在 MCP 配置文件中添加:
json { "mcpServers": { "browserbase": { "command" : "node", "args" : ["/path/to/mcp-server-browserbase/browserbase/cli.js"], // 替换为实际路径 "env": { "BROWSERBASE_API_KEY": "YOUR_BROWSERBASE_API_KEY", "BROWSERBASE_PROJECT_ID": "YOUR_BROWSERBASE_PROJECT_ID" } } } }
- 使用 SSE(服务器发送事件):
- 首先,在终端启动服务器(可以添加下文提到的配置标志):
bash node /path/to/mcp-server-browserbase/browserbase/cli.js --port 8931
- 然后,在 MCP 配置文件中添加:
json { "mcpServers": { "browserbase": { "url": "http://localhost:8931/sse", // 确保端口匹配 "env": { "BROWSERBASE_API_KEY": "YOUR_BROWSERBASE_API_KEY", "BROWSERBASE_PROJECT_ID": "YOUR_BROWSERBASE_PROJECT_ID" } } } }
- 首先,在终端启动服务器(可以添加下文提到的配置标志):
- 使用 STDIO(标准输入输出): 在 MCP 配置文件中添加:
进阶配置(命令行标志)
在本地运行或使用 npx
时,你可以通过命令行标志进行更详细的配置(在 MCP 配置文件的 args
数组中添加):
--proxies
: 启用 Browserbase 代理。--contextId <YOUR_CONTEXT_ID>
: 使用指定的 Browserbase Context ID 来保持会话持久性。--persist false
: 如果不想让当前会话的更改(如新 Cookie)保存回 Context,可以设置为false
(默认为true
)。--cookies '[{"name": "...", "value": "...", "domain": "...", ...}]'
: 注入符合 Playwright 格式的 Cookie JSON 数组。这对于处理会话 Cookie 或预设登录状态很有用。--browserWidth <width>
和--browserHeight <height>
: 设置浏览器视口的宽度和高度(默认 1024×768)。
总结
Browserbase MCP 服务器为 LLM 应用打开了一扇通往动态、实时网络世界的大门。无论是需要自动化网页任务、保持复杂网站的登录状态,还是进行需要代理或特定 Cookie 的操作,它都提供了强大而灵活的解决方案。通过简单的配置,你就能让你的 AI 助手真正具备网络浏览的能力。
评论 (0)