技能 browser-act
🌐

browser-act

低风险 ⚙️ 外部命令🌐 网络访问📁 文件系统访问

使用隐身模式和验证码破解功能自动化浏览器

AI代理需要可靠的浏览器自动化功能来进行网页抓取、表单填写和数据提取。browser-act 提供结构化CLI,具备反检测能力和内置验证码破解功能。

支持: Claude Codex Code(CC)
🥉 74 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“browser-act”。 browser-act stealth-extract https://news.ycombinator.com

预期结果:

以markdown格式返回页面内容,提取标题、分数和评论

正在使用“browser-act”。 browser-act state

预期结果:

返回索引列表:[1] input 'Search', [3] button 'Submit', [5] link 'About'

正在使用“browser-act”。 browser-act navigate https://example.com && browser-act wait stable && browser-act screenshot

预期结果:

打开页面,等待稳定,返回屏幕截图路径

安全审计

低风险
v1 • 4/28/2026

Static analysis detected 283 potential issues, primarily false positives from markdown documentation of CLI commands. The skill uses a structured CLI interface for browser automation with transparent security documentation. All external command patterns are well-defined CLI invocations, not arbitrary shell execution. Network access is limited to documented cloud services for captcha solving. Filesystem access is scoped to browser profile directories. Human oversight mechanisms (policies, human-assist-url) provide appropriate safeguards.

6
已扫描文件
694
分析行数
3
发现项
1
审计总数

风险因素

⚙️ 外部命令 (1)
🌐 网络访问 (1)
📁 文件系统访问 (1)
审计者: claude

质量评分

50
架构
100
可维护性
87
内容
50
社区
90
安全
83
规范符合性

你能构建什么

从电商网站提取产品数据

自动化抓取具有反爬保护网站的产品列表、价格和评论。使用隐身模式避免被检测。

自动填写表单和提交数据

导航多步骤表单,处理下拉菜单和复选框,并提交数据。基于凭据的登录需要先进行人工确认。

监控变化的网页内容

定期截取屏幕截图或提取文本以检测监控页面的变化。使用并行会话检查多个网站。

试试这些提示

简单页面提取
从 {url} 提取主要内容并以markdown格式返回
表单填写工作流
在新浏览器中打开 {url},找到登录表单,等待其加载,然后显示有哪些字段可用
多步骤自动化
导航到 {url},点击标记为 '{element}' 的元素,等待页面稳定,然后提取所有标题
验证码处理
打开 {url},尝试破解页面上的任何验证码,然后继续登录流程

最佳实践

  • 在任何改变页面内容的操作后运行 wait stable 和 state
  • 使用 stealth-extract 进行简单内容检索,无需会话开销
  • 在每个任务开始时检查 references/policies.md 以获取人工协助触发条件

避免

  • 除非用户明确提供,否则不要填写凭据
  • 不要链接需要解析中间输出的命令
  • 不要假设元素索引在页面导航后仍然有效

常见问题

如何安装 browser-act?
运行:uv tool install browser-act-cli --python 3.12
隐身模式和真实Chrome模式有什么区别?
隐身模式使用反检测指纹技术访问有机器人保护的网站。真实Chrome连接到您本地带有现有登录会话的Chrome。
如何处理验证码?
当页面上出现验证码挑战时,使用 browser-act solve-captcha。
可以并行运行多个浏览器会话吗?
可以,使用 --session 标志创建隔离会话:browser-act --session task-a browser open <id> <url>
浏览器配置文件存储在哪里?
macOS: ~/Library/Application Support/browseract/, Windows: %APPDATA%\browseract, Linux: ~/.local/share/browseract
如何停止自动化并获取人工帮助?
策略会在凭据、失败的验证码、付款和卡住操作时自动触发人工协助。使用 human-assist-url 请求远程访问。

开发者详情

文件结构