Навыки agent-browser
🌐

agent-browser

Безопасно ⚙️ Внешние команды🌐 Доступ к сети📁 Доступ к файловой системе

Автоматизация веб-браузинга с помощью AI-агентов

Также доступно от: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

AI-агенты должны взаимодействовать с веб-сайтами, но не имеют встроенных браузерных возможностей. Этот навык обеспечивает автоматизацию безголового браузера через inference.sh, позволяя Claude, Codex и Claude Code перемещаться по страницам, заполнять формы, делать скриншоты и записывать сессии.

Поддерживает: Claude Codex Code(CC)
🥉 76 Бронза
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «agent-browser». Open https://example.com and identify the login form elements

Ожидаемый результат:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

Использование «agent-browser». Fill and submit the login form with test credentials

Ожидаемый результат:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

Использование «agent-browser». Take a screenshot of the dashboard

Ожидаемый результат:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

Аудит безопасности

Безопасно
v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

10
Просканировано файлов
2,313
Проанализировано строк
3
находки
1
Всего аудитов
Проверено: claude

Оценка качества

45
Архитектура
100
Сопровождаемость
87
Контент
50
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Исследования и извлечение данных

AI-агенты просматривают веб-сайты для сбора информации, извлечения структурированных данных со страниц и составления исследовательских отчётов без ручного браузинга.

Автоматическая отправка форм

AI-агенты заполняют и отправляют веб-формы для таких задач, как бронирование записей, регистрация аккаунтов или выполнение пакетного ввода данных.

Браузерное тестирование

QA-инженеры используют AI-агентов для навигации по веб-сайтам, создания скриншотов и записи тестовых сессий для проверки функциональности UI.

Попробуйте эти промпты

Базовая навигация по странице
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Процесс заполнения формы
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Аутентифицированная сессия с извлечением данных
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Многостраничное исследовательская сессия
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

Лучшие практики

  • Всегда создавайте повторный снимок после навигации или изменений DOM; ссылки на элементы устаревают после загрузки страницы
  • Используйте переменные окружения для учётных данных; никогда не встраивайте пароли в скрипты
  • Закрывайте сессии по завершении; видеозаписи доступны только до вызова close

Избегать

  • Не кешируйте ссылки на элементы между разными страницами; всегда создавайте снимок после навигации
  • Не встраивайте учётные данные; используйте переменные окружения, такие как $APP_USERNAME и $APP_PASSWORD
  • Не пропускайте время ожидания после действий; дайте страницам полностью загрузиться перед взаимодействием

Часто задаваемые вопросы

Что такое inference.sh и нужно ли его устанавливать?
Да, inference.sh требуется. Он предоставляет CLI (infsh), который запускает автоматизацию браузера. Установите его с raw.githubusercontent.com/inference-sh/skills/main/cli-install.md
Почему ссылки на элементы, такие как @e1, перестают работать?
Ссылки на элементы становятся недействительными после навигации по странице, изменений DOM или загрузки динамического контента. Всегда вызывайте функцию snapshot после этих событий, чтобы получить свежие ссылки.
Как обрабатывать вход на защищённые сайты?
Используйте навык agent-browser для автоматизации процесса входа в систему один раз, затем повторно используйте ID сессии для последующих аутентифицированных запросов. Справочник authentication.md объясняет эту схему.
Можно ли записывать браузерные сессии в видео?
Да, включите record_video: true в функции open. Вызовите close для получения файла видео. Курсор можно отобразить с помощью show_cursor: true для более наглядных демонстраций.
Как загружать файлы через браузер?
Используйте действие upload с массивом file_paths. Ссылка должна указывать на элемент ввода файла. Пример: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}
Что происходит, если браузерная сессия истекает?
Сессии не сохраняются при перезапуске сервера. Всегда обрабатывайте ошибки корректно и перезапускайте рабочий процесс при необходимости. Видеозаписи теряются, если close не вызван до таймаута.

Сведения для разработчиков

Автор

skillssh

Лицензия

MIT

Ссылка

main