agent-browser
Автоматизация веб-браузинга с помощью AI-агентов
Также доступно от: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs
AI-агенты должны взаимодействовать с веб-сайтами, но не имеют встроенных браузерных возможностей. Этот навык обеспечивает автоматизацию безголового браузера через inference.sh, позволяя Claude, Codex и Claude Code перемещаться по страницам, заполнять формы, делать скриншоты и записывать сессии.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «agent-browser». Open https://example.com and identify the login form elements
Ожидаемый результат:
Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'
Использование «agent-browser». Fill and submit the login form with test credentials
Ожидаемый результат:
Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.
Использование «agent-browser». Take a screenshot of the dashboard
Ожидаемый результат:
Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons
Аудит безопасности
БезопасноAll static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.
Факторы риска
⚙️ Внешние команды (4)
🌐 Доступ к сети (4)
📁 Доступ к файловой системе (2)
Оценка качества
Что вы можете построить
Исследования и извлечение данных
AI-агенты просматривают веб-сайты для сбора информации, извлечения структурированных данных со страниц и составления исследовательских отчётов без ручного браузинга.
Автоматическая отправка форм
AI-агенты заполняют и отправляют веб-формы для таких задач, как бронирование записей, регистрация аккаунтов или выполнение пакетного ввода данных.
Браузерное тестирование
QA-инженеры используют AI-агентов для навигации по веб-сайтам, создания скриншотов и записи тестовых сессий для проверки функциональности UI.
Попробуйте эти промпты
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.
Лучшие практики
- Всегда создавайте повторный снимок после навигации или изменений DOM; ссылки на элементы устаревают после загрузки страницы
- Используйте переменные окружения для учётных данных; никогда не встраивайте пароли в скрипты
- Закрывайте сессии по завершении; видеозаписи доступны только до вызова close
Избегать
- Не кешируйте ссылки на элементы между разными страницами; всегда создавайте снимок после навигации
- Не встраивайте учётные данные; используйте переменные окружения, такие как $APP_USERNAME и $APP_PASSWORD
- Не пропускайте время ожидания после действий; дайте страницам полностью загрузиться перед взаимодействием