🌐

agent-browser

Name: agent-browser
Author: inference-sh-0

Riesgo bajo ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatizar Tareas del Navegador con Agentes IA

También disponible en: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

Esta skill permite a los agentes IA automatizar interacciones con el navegador incluyendo navegación, relleno de formularios, extracción de datos y grabación visual a través de un simple sistema de referencias @e.

Soporta: Claude Codex Code(CC)

⚠️ 68 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and get elements

Resultado esperado:

Session started with ID: abc123. Elements found: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

Usando "agent-browser". Fill login form and submit

Resultado esperado:

Filled @e1 with 'user@example.com', filled @e2 with 'password123', clicked @e3. Navigation detected. Re-snapshot recommended.

Usando "agent-browser". Take screenshot

Resultado esperado:

Screenshot captured: {base64 encoded image data}, dimensions: 1920x1080

Auditoría de seguridad

Riesgo bajo

v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

Archivos escaneados

2,310

Líneas analizadas

hallazgos

Auditorías totales

Problemas de riesgo bajo (3)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215

Documentation Contains Shell Command Examples

The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.

SKILL.md:9-11 SKILL.md:20

Example URLs in Documentation

Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.

references/session-management.md:20-21 references/session-management.md:67-69

Browser Session Management

Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.

Factores de riesgo

⚙️ Comandos externos (5)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215 references/authentication.md:20-21 references/commands.md:9-11

🌐 Acceso a red (2)

SKILL.md:9-11 SKILL.md:35

📁 Acceso al sistema de archivos (1)

SKILL.md:162-163

Auditado por: claude

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Envío Automatizado de Formularios

Rellenar y enviar formularios web programáticamente para automatización de entrada de datos

Extracción de Contenido Web

Navegar sitios web y extraer datos estructurados para investigación o monitoreo

Pruebas Visuales del Navegador

Grabar interacciones del navegador para crear documentación visual o depurar problemas

Prueba estos prompts

Abrir y Navegar

Usa la skill agent-browser para abrir [URL] y obtener las referencias de elementos de todos los elementos interactivos en la página.

Rellenar Campos de Formulario

Usando la sesión [SESSION_ID], rellena el campo de formulario con ref @e1 con el texto '[TEXT]', luego haz clic en el botón con ref @e2.

Capturar Captura de Pantalla

Toma una captura de pantalla de página completa de la sesión actual [SESSION_ID] y guárdala.

Extraer Datos Después de Acción

Haz clic en el elemento @e1 para navegar a la siguiente página, luego toma una instantánea y extrae todo el texto de encabezados de la nueva página.

Mejores prácticas

Siempre vuelve a tomar una instantánea después de la navegación para obtener referencias de elementos frescas
Usa esperas explícitas después de acciones que activan carga asíncrona
Cierra las sesiones cuandoTermines para liberar recursos del navegador
Habilita la grabación de video solo cuando sea necesario para depuración

Evitar

Usar referencias de elementos de una página anterior sin volver a tomar instantánea
No manejar la navegación después de acciones de clic
Filtrar IDs de sesión o no gestionar el ciclo de vida de la sesión
Intentar interactuar con elementos que pueden no ser visibles

Preguntas frecuentes

¿Qué es el sistema de referencias @e?

Los elementos en la página se devuelven con prefijos @e como @e1, @e2. Estas referencias se usan para identificar con qué elemento interactuar. Las referencias cambian después de cada instantánea.

¿Por qué necesito volver a tomar instantánea después de la navegación?

Cuando navegas a una nueva página, el DOM cambia completamente. Las referencias de elementos anteriores se invalidan y se deben obtener nuevas referencias.

¿Puede esta skill evadir páginas de inicio de sesión?

La skill puede automatizar formularios de inicio de sesión pero no puede evadir autenticación. Puede ayudar a mantener sesiones iniciada para operaciones subsequentes.

¿Está la grabación de video siempre habilitada?

No, la grabación de video debe habilitarse explícitamente con record_video: true en la función open. Está desactivada por defecto.

¿Qué opciones de proxy están disponibles?

La skill soporta proxies HTTP, HTTPS y SOCKS5 con autenticación opcional a través de proxy_username y proxy_password.

¿Puedo ejecutar JavaScript personalizado?

Sí, usa la función execute para ejecutar código JavaScript en el contexto del navegador. El resultado se devuelve como una cadena.