Habilidades agent-browser
🌐

agent-browser

Riesgo medio ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Автоматизация веб-браузеров для ИИ-агентов

También disponible en: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,skillssh,supercent-io,tul-sh,inf-sh,vercel-labs

ИИ-агентам необходимо взаимодействовать с веб-сайтами, но у них нет собственного доступа к браузерам. Этот навык предоставляет автоматизацию браузера на основе Playwright через inference.sh, обеспечивая навигацию, взаимодействие с элементами, создание снимков экрана и видеозапись с управлением сеансами для сложных многошаговых рабочих процессов.

Soporta: Claude Codex Code(CC)
⚠️ 62 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Navigate to example.com and show available elements

Resultado esperado:

Сеанс создан: sess_abc123. Страница успешно загружена. Доступные элементы: @e1 [h1] 'Example Domain', @e2 [p] 'This domain is for use in documentation', @e3 [a] 'Learn more' href='https://iana.org/domains/example'

Usando "agent-browser". Fill form and submit

Resultado esperado:

Элемент @e1 заполнен 'test@example.com'. Элемент @e2 заполнен 'password'. Элемент @e3 нажат. Страница перешла на /dashboard. Сеанс остается активным.

Usando "agent-browser". Take screenshot of current page

Resultado esperado:

Снимок экрана создан: screenshot_20260312_082145.png (1920x1080). Изображение сохранено в /tmp/browser-sessions/sess_abc123/screenshots/. Предварительный просмотр Base64 доступен в ответе.

Auditoría de seguridad

Riesgo medio
v1 • 3/12/2026

Static analyzer flagged 606 patterns across 10 files (2313 lines). Most findings are false positives: external_commands are documentation examples showing CLI usage, network patterns are example URLs, filesystem patterns are markdown relative links. The skill legitimately requires Bash permissions for inference.sh CLI, network access for browser automation, and filesystem access for screenshots/videos. No malicious intent detected. Users should understand the powerful capabilities this skill provides.

10
Archivos escaneados
2,313
Líneas analizadas
8
hallazgos
1
Auditorías totales
Problemas de riesgo medio (3)
Extensive External Command Usage
The skill uses Bash(infsh *) permission extensively for browser automation via inference.sh CLI. While this is the intended functionality, users should understand this grants significant system access.
Browser Credential and Cookie Access
The skill can access browser cookies and storage via JavaScript execution. This is required for authenticated browsing but could expose session tokens if misused.
Screen Capture and Video Recording
The skill can capture screenshots and record video of browser sessions. This capability could capture sensitive information displayed during automation.
Problemas de riesgo bajo (2)
Hardcoded Example URLs in Documentation
Documentation contains example URLs (example.com, inference.sh). These are documentation examples, not malicious endpoints.
SOCKS Proxy Configuration Support
The skill supports SOCKS proxy configuration for browser traffic routing. This is a legitimate privacy/networking feature.
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
22
Comunidad
46
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Веб-скрапинг и извлечение данных

Извлечение структурированных данных с веб-сайтов, требующих рендеринга JavaScript или взаимодействия пользователя, таких как панели управления, динамический контент или сайты без общедоступных API.

Автоматизированное тестирование и QA

Тестирование веб-приложений с помощью автоматизации пользовательских рабочих процессов, отправки форм, путей навигации и визуальной проверки через снимки экрана.

Исследование агентов и сбор информации

Позволяет ИИ-агентам просматривать веб-сайты, читать документацию, проверять наличие продуктов, отслеживать цены или собирать информацию из веб-источников.

Prueba estos prompts

Базовая навигация по странице
Откройте сеанс браузера и перейдите на https://example.com. Покажите, какие интерактивные элементы доступны на странице.
Автоматизация форм
Создайте сеанс браузера для заполнения контактной формы на https://example.com/contact. Найдите поля имени, электронной почты и сообщения, заполните их тестовыми данными и отправьте форму. Сделайте снимок экрана после отправки.
Аутентифицированное извлечение данных
Запустите записываемый сеанс браузера. Войдите на https://app.example.com, используя учетные данные из переменных среды. Перейдите на панель управления, извлеките все метрики, отображаемые в таблице, и закройте сеанс, вернув видео.
Сложный многостраничный рабочий процесс
Создайте сеанс браузера с SOCKS прокси. Найдите продукты на сайте электронной коммерции, отфильтруйте по ценовому диапазону, откройте первые 3 страницы продуктов последовательно, извлеките данные о продуктах из каждого и составьте сводку сравнения. Запишите весь рабочий процесс.

Mejores prácticas

  • Всегда закрывайте сеансы по завершении, чтобы освободить ресурсы и получить видеозаписи, если они включены
  • Используйте переменные среды для учетных данных вместо их жесткого кодирования в скриптах автоматизации
  • Делайте снимки после любой навигации или действия, изменяющего DOM, чтобы получить свежие ссылки на элементы
  • Используйте действия ожидания или явные условия перед взаимодействием с динамически загружаемыми элементами

Evitar

  • Не жестко кодируйте учетные данные непосредственно в скриптах автоматизации или промптах
  • Не предполагайте, что ссылки на элементы сохраняются после навигации по странице - всегда делайте новый снимок
  • Не оставляйте сеансы работающими бесконечно - реализуйте логику тайм-аута и очистки
  • Не используйте для обхода мер безопасности, CAPTCHA или несанкционированного доступа к защищенным ресурсам

Preguntas frecuentes

Что нужно установить перед использованием этого навыка?
Вам нужен CLI inference.sh (infsh). Выполните 'npx skills add inference-sh/skills@agent-tools' для получения инструкций по установке, затем аутентифицируйтесь с помощью 'infsh login'.
Как работают ссылки на элементы (@e1, @e2)?
Когда вы открываете страницу или вызываете snapshot, навык возвращает список интерактивных элементов со ссылками @e. Используйте эти ссылки в командах interact, таких как click или fill. Ссылки истекают при изменении DOM.
Может ли этот навык обрабатывать вход и аутентифицированные сеансы?
Да. Сеансы сохраняют файлы cookie и localStorage между вызовами функций. Заполните формы входа, отправьте их, и последующие действия в этом сеансе остаются аутентифицированными. См. authentication.md для шаблонов OAuth и 2FA.
Как работает видеозапись?
Включите видео, добавив 'record_video': true во входные данные функции open. Видео записывается на протяжении всего сеанса и возвращается при вызове функции close. Видео доступны только до закрытия сеанса.
Можно ли использовать прокси с этим навыком?
Да. Добавьте 'proxy': {'server': 'http://proxy.example.com:8080'} или SOCKS с 'proxy': {'server': 'socks5://proxy.example.com:1080'} во входные данные функции open. См. proxy-support.md для подробностей.
Что произойдет, если я забуду закрыть сеанс?
Сеансы потребляют рес��рсы сервера. Хотя может быть автоматическая очистка, всегда явно вызывайте close по завершении. Незакрытые сеансы могут истечь по тайм-ауту, но это не гарантируется.