🌐

agent-browser

Name: agent-browser
Author: inference-shell

Средний риск ⚙️ Внешние команды🌐 Доступ к сети📁 Доступ к файловой системе

Автоматизация веб-браузеров для ИИ-агентов

Также доступно от: inference-sh-8,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

ИИ-агентам необходимо взаимодействовать с веб-сайтами, но у них нет собственного доступа к браузерам. Этот навык предоставляет автоматизацию браузера на основе Playwright через inference.sh, обеспечивая навигацию, взаимодействие с элементами, создание снимков экрана и видеозапись с управлением сеансами для сложных многошаговых рабочих процессов.

Поддерживает: Claude Codex Code(CC)

⚠️ 62 Плохо

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «agent-browser». Navigate to example.com and show available elements

Ожидаемый результат:

Сеанс создан: sess_abc123. Страница успешно загружена. Доступные элементы: @e1 [h1] 'Example Domain', @e2 [p] 'This domain is for use in documentation', @e3 [a] 'Learn more' href='https://iana.org/domains/example'

Использование «agent-browser». Fill form and submit

Ожидаемый результат:

Элемент @e1 заполнен 'test@example.com'. Элемент @e2 заполнен 'password'. Элемент @e3 нажат. Страница перешла на /dashboard. Сеанс остается активным.

Использование «agent-browser». Take screenshot of current page

Ожидаемый результат:

Снимок экрана создан: screenshot_20260312_082145.png (1920x1080). Изображение сохранено в /tmp/browser-sessions/sess_abc123/screenshots/. Предварительный просмотр Base64 доступен в ответе.

Аудит безопасности

Средний риск

v1 • 3/12/2026

Static analyzer flagged 606 patterns across 10 files (2313 lines). Most findings are false positives: external_commands are documentation examples showing CLI usage, network patterns are example URLs, filesystem patterns are markdown relative links. The skill legitimately requires Bash permissions for inference.sh CLI, network access for browser automation, and filesystem access for screenshots/videos. No malicious intent detected. Users should understand the powerful capabilities this skill provides.

Просканировано файлов

2,313

Проанализировано строк

находки

Всего аудитов

Проблемы среднего риска (3)

SKILL.md:4

Extensive External Command Usage

The skill uses Bash(infsh *) permission extensively for browser automation via inference.sh CLI. While this is the intended functionality, users should understand this grants significant system access.

references/authentication.md:215-225 references/session-management.md:67-72

Browser Credential and Cookie Access

The skill can access browser cookies and storage via JavaScript execution. This is required for authenticated browsing but could expose session tokens if misused.

SKILL.md:67-68 references/video-recording.md:1-50

Screen Capture and Video Recording

The skill can capture screenshots and record video of browser sessions. This capability could capture sensitive information displayed during automation.

Проблемы низкого риска (2)

SKILL.md:9-11 references/authentication.md:25

Hardcoded Example URLs in Documentation

Documentation contains example URLs (example.com, inference.sh). These are documentation examples, not malicious endpoints.

references/proxy-support.md:152-168

SOCKS Proxy Configuration Support

The skill supports SOCKS proxy configuration for browser traffic routing. This is a legitimate privacy/networking feature.

Факторы риска

⚙️ Внешние команды (4)

SKILL.md:4 templates/authenticated-session.sh:1 templates/capture-workflow.sh:1 templates/form-automation.sh:1

🌐 Доступ к сети (3)

SKILL.md:9 SKILL.md:11 references/proxy-support.md:23-24

📁 Доступ к файловой системе (2)

references/authentication.md:5 templates/capture-workflow.sh:78-81

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

Безопасность

Соответствие спецификации

Что вы можете построить

Веб-скрапинг и извлечение данных

Извлечение структурированных данных с веб-сайтов, требующих рендеринга JavaScript или взаимодействия пользователя, таких как панели управления, динамический контент или сайты без общедоступных API.

Автоматизированное тестирование и QA

Тестирование веб-приложений с помощью автоматизации пользовательских рабочих процессов, отправки форм, путей навигации и визуальной проверки через снимки экрана.

Исследование агентов и сбор информации

Позволяет ИИ-агентам просматривать веб-сайты, читать документацию, проверять наличие продуктов, отслеживать цены или собирать информацию из веб-источников.

Попробуйте эти промпты

Базовая навигация по странице

Откройте сеанс браузера и перейдите на https://example.com. Покажите, какие интерактивные элементы доступны на странице.

Автоматизация форм

Создайте сеанс браузера для заполнения контактной формы на https://example.com/contact. Найдите поля имени, электронной почты и сообщения, заполните их тестовыми данными и отправьте форму. Сделайте снимок экрана после отправки.

Аутентифицированное извлечение данных

Запустите записываемый сеанс браузера. Войдите на https://app.example.com, используя учетные данные из переменных среды. Перейдите на панель управления, извлеките все метрики, отображаемые в таблице, и закройте сеанс, вернув видео.

Сложный многостраничный рабочий процесс

Создайте сеанс браузера с SOCKS прокси. Найдите продукты на сайте электронной коммерции, отфильтруйте по ценовому диапазону, откройте первые 3 страницы продуктов последовательно, извлеките данные о продуктах из каждого и составьте сводку сравнения. Запишите весь рабочий процесс.

Лучшие практики

Всегда закрывайте сеансы по завершении, чтобы освободить ресурсы и получить видеозаписи, если они включены
Используйте переменные среды для учетных данных вместо их жесткого кодирования в скриптах автоматизации
Делайте снимки после любой навигации или действия, изменяющего DOM, чтобы получить свежие ссылки на элементы
Используйте действия ожидания или явные условия перед взаимодействием с динамически загружаемыми элементами

Избегать

Не жестко кодируйте учетные данные непосредственно в скриптах автоматизации или промптах
Не предполагайте, что ссылки на элементы сохраняются после навигации по странице - всегда делайте новый снимок
Не оставляйте сеансы работающими бесконечно - реализуйте логику тайм-аута и очистки
Не используйте для обхода мер безопасности, CAPTCHA или несанкционированного доступа к защищенным ресурсам

Часто задаваемые вопросы

Что нужно установить перед использованием этого навыка?

Вам нужен CLI inference.sh (infsh). Выполните 'npx skills add inference-sh/skills@agent-tools' для получения инструкций по установке, затем аутентифицируйтесь с помощью 'infsh login'.

Как работают ссылки на элементы (@e1, @e2)?

Когда вы открываете страницу или вызываете snapshot, навык возвращает список интерактивных элементов со ссылками @e. Используйте эти ссылки в командах interact, таких как click или fill. Ссылки истекают при изменении DOM.

Может ли этот навык обрабатывать вход и аутентифицированные сеансы?

Да. Сеансы сохраняют файлы cookie и localStorage между вызовами функций. Заполните формы входа, отправьте их, и последующие действия в этом сеансе остаются аутентифицированными. См. authentication.md для шаблонов OAuth и 2FA.

Как работает видеозапись?

Включите видео, добавив 'record_video': true во входные данные функции open. Видео записывается на протяжении всего сеанса и возвращается при вызове функции close. Видео доступны только до закрытия сеанса.

Можно ли использовать прокси с этим навыком?

Да. Добавьте 'proxy': {'server': 'http://proxy.example.com:8080'} или SOCKS с 'proxy': {'server': 'socks5://proxy.example.com:1080'} во входные данные функции open. См. proxy-support.md для подробностей.

Что произойдет, если я забуду закрыть сеанс?

Сеансы потребляют рес��рсы сервера. Хотя может быть автоматическая очистка, всегда явно вызывайте close по завершении. Незакрытые сеансы могут истечь по тайм-ауту, но это не гарантируется.