技能 agent-browser
🌐

agent-browser

中风险 ⚙️ 外部命令🌐 网络访问📁 文件系统访问

使用AI代理自动执行浏览器任务

也可从以下获取: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh

AI代理需要与网页交互但缺乏浏览器功能。此技能通过简单的shell命令提供无头浏览器自动化,实现网页抓取、表单填写和自动化测试工作流。

支持: Claude Codex Code(CC)
⚠️ 66
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“agent-browser”。 Open example.com and list clickable elements

预期结果:

Session started: abc123
URL: https://example.com
Title: Example Domain

Clickable Elements:
- @e1 [a] 'More information...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Get Started'
- @e4 [input type='email'] placeholder='Enter your email'

Screenshot saved to: ./screenshots/example.com_20240101.png

正在使用“agent-browser”。 Fill login form and verify success

预期结果:

Login workflow completed:
1. Opened login page
2. Filled email field with user@example.com
3. Filled password field
4. Clicked Sign In button
5. Waited for redirect
6. Verified URL changed from /login to /dashboard
7. Captured dashboard screenshot

Session ID: abc123 (active)
Screenshot: ./screenshots/dashboard_20240101.png

安全审计

中风险
v1 • 4/29/2026

Static analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.

10
已扫描文件
2,313
分析行数
7
发现项
1
审计总数
中风险问题 (4)
Shell Command Usage in Documentation
501 shell command patterns detected in documentation files (authentication.md, commands.md, proxy-support.md, etc.). These are example commands showing how to use the belt CLI tool, not actual code execution vulnerabilities.
Browser Credential and Storage Access
Skill accesses browser session state including cookies, LocalStorage, and SessionStorage. This is expected behavior for browser automation tools and is documented for legitimate use cases.
Network Access for Browser Service
Skill communicates with inference.sh service for browser control. URLs in documentation are legitimate service endpoints.
Path Traversal Patterns in Documentation
Path traversal patterns (../) found in documentation are relative paths for file references, not actual path traversal vulnerabilities.
审计者: claude

质量评分

45
架构
100
可维护性
87
内容
50
社区
45
安全
91
规范符合性

你能构建什么

用于研究目的的网页数据提取

通过导航页面、填写搜索表单和收集页面内容,从网站提取结构化数据。适用于市场研究、竞品分析和数据收集任务。

自动化表单提交工作流

自动执行重复性的表单填写任务,如求职申请、调查完成或数据录入。处理带条件导航和验证的多步骤表单。

基于浏览器的API测试

测试需要浏览器上下文才能运行的Web应用程序,如带有客户端身份验证的SPA或JavaScript密集型工作流。捕获截图和视频用于文档记录。

试试这些提示

打开网站并探索
Use the agent-browser skill to open https://example.com, take a screenshot, and list all clickable elements on the page.
登录并验证访问权限
Use agent-browser to log into https://app.example.com with email user@example.com and password from the PASSWORD environment variable. After login, verify you can access the dashboard page and take a screenshot.
多步骤表单自动化
Create a script using agent-browser to fill a multi-step registration form: open the form, fill step 1 with name and email, proceed to step 2, fill address details, submit, and verify success message.
并行会话数据收集
Use agent-browser to open three different product pages in parallel sessions, extract prices and availability from each, and close all sessions. Compare the collected data.

最佳实践

  • 始终使用环境变量存储密码等敏感数据,避免在脚本中硬编码凭据
  • 在任何导航或DOM更改后重新获取页面快照,以在交互前获取新的元素引用
  • 仅在调试期间启用视频录制,避免在生产环境中捕获敏感信息

避免

  • 不要在脚本或命令参数中直接硬编码密码或API密钥
  • 不要在页面导航后跳过快照步骤——过时的元素引用会导致失败
  • 不要让会话保持不必要地打开——完成后始终关闭会话以释放资源

常见问题

什么是inference.sh,为什么需要它?
Inference.sh是运行无头浏览器的云服务。您需要一个账户才能使用此技能所依赖的belt CLI工具。
此技能能绕过CAPTCHA吗?
不,此技能无法绕过CAPTCHA或高级机器人检测系统。它仅适用于标准网页。
如何处理需要双因素身份验证的登录页面?
使用会话持久化功能手动完成2FA步骤,然后让AI代理继续使用已验证的会话。
为什么我的元素引用不工作?
元素引用在页面导航或动态内容更改后会变为过时。始终调用快照功能以获取新的引用。
我可以同时运行多个浏览器会话吗?
可以,您可以通过使用不同的会话ID创建多个并行会话。每个会话维护自己的浏览器上下文。
如何保存截图或视频?
截图以base64数据或文件形式返回。在打开时启用record_video来捕获视频,该视频在您关闭会话时返回。