agent-browser
使用 AI 代理自动执行网页浏览
也可从以下获取: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs
AI 代理需要与网站交互,但缺乏浏览器能力。此技能通过 inference.sh 提供无头浏览器自动化,使 Claude、Codex 和 Claude Code 能够导航页面、填写表单、截取屏幕截图和录制会话。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“agent-browser”。 打开 https://example.com 并识别登录表单元素
预期结果:
页面加载成功。找到 3 个交互元素:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'
正在使用“agent-browser”。 使用测试凭据填写并提交登录表单
预期结果:
表单已提交。页面重定向到仪表板。
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
屏幕截图已捕获。
正在使用“agent-browser”。 截取仪表板的屏幕截图
预期结果:
屏幕截图已保存到 dashboard-20240101.png
页面标题:仪表板 | 尺寸:1280x720
仪表板包含:导航菜单、用户资料卡、数据表格、操作按钮
安全审计
安全All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.
风险因素
质量评分
你能构建什么
研究和数据提取
AI 代理浏览网站以收集信息、提取结构化数据并编译研究报告,无需手动浏览。
自动表单提交
AI 代理填写并提交网页表单,用于预约、注册账户或完成批量数据录入等任务。
基于浏览器的测试
QA 工程师使用 AI 代理浏览网站、截取屏幕截图和录制测试会话,以验证 UI 功能。
试试这些提示
使用 agent-browser 技能打开 https://example.com 并显示页面上的所有可点击元素。
打开 https://example.com/contact 上的联系表单。在姓名中输入 'John Doe'、在邮箱中输入 'john@example.com',然后提交表单。截取结果的屏幕截图。
使用环境变量中的凭据登录 https://app.example.com。导航到仪表板,提取所有表格数据,并保存最终页面的屏幕截图。
在浏览 example.com/products 时录制视频。点击浏览 5 个产品,为最后一个产品填写咨询表单,然后关闭会话以保存录制。
最佳实践
- 导航或 DOM 变更后始终重新快照;元素引用在页面加载后会失效
- 使用环境变量存储凭据;切勿在脚本中硬编码密码
- 完成后关闭会话;视频录制仅在调用 close 前可用
避免
- 不要在不同页面间缓存元素引用;导航后始终进行快照
- 不要硬编码凭据;使用环境变量如 $APP_USERNAME 和 $APP_PASSWORD
- 不要跳过操作后的等待时间;在交互前允许页面完全加载