Habilidades agent-browser
🌐

agent-browser

Riesgo bajo ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatizar Tareas del Navegador con Agentes IA

También disponible en: inference-sh-8,vercel-labs,inferencesh,inf-sh

Esta skill permite a los agentes IA automatizar interacciones con el navegador incluyendo navegación, relleno de formularios, extracción de datos y grabación visual a través de un simple sistema de referencias @e.

Soporta: Claude Codex Code(CC)
🥉 73 Bronce
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and get elements

Resultado esperado:

Session started with ID: abc123. Elements found: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

Usando "agent-browser". Fill login form and submit

Resultado esperado:

Filled @e1 with 'user@example.com', filled @e2 with 'password123', clicked @e3. Navigation detected. Re-snapshot recommended.

Usando "agent-browser". Take screenshot

Resultado esperado:

Screenshot captured: {base64 encoded image data}, dimensions: 1920x1080

Auditoría de seguridad

Riesgo bajo
v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

10
Archivos escaneados
2,310
Líneas analizadas
6
hallazgos
1
Auditorías totales
Problemas de riesgo bajo (3)
Documentation Contains Shell Command Examples
The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.
Example URLs in Documentation
Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.
Browser Session Management
Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
85
Contenido
50
Comunidad
84
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Envío Automatizado de Formularios

Rellenar y enviar formularios web programáticamente para automatización de entrada de datos

Extracción de Contenido Web

Navegar sitios web y extraer datos estructurados para investigación o monitoreo

Pruebas Visuales del Navegador

Grabar interacciones del navegador para crear documentación visual o depurar problemas

Prueba estos prompts

Abrir y Navegar
Usa la skill agent-browser para abrir [URL] y obtener las referencias de elementos de todos los elementos interactivos en la página.
Rellenar Campos de Formulario
Usando la sesión [SESSION_ID], rellena el campo de formulario con ref @e1 con el texto '[TEXT]', luego haz clic en el botón con ref @e2.
Capturar Captura de Pantalla
Toma una captura de pantalla de página completa de la sesión actual [SESSION_ID] y guárdala.
Extraer Datos Después de Acción
Haz clic en el elemento @e1 para navegar a la siguiente página, luego toma una instantánea y extrae todo el texto de encabezados de la nueva página.

Mejores prácticas

  • Siempre vuelve a tomar una instantánea después de la navegación para obtener referencias de elementos frescas
  • Usa esperas explícitas después de acciones que activan carga asíncrona
  • Cierra las sesiones cuandoTermines para liberar recursos del navegador
  • Habilita la grabación de video solo cuando sea necesario para depuración

Evitar

  • Usar referencias de elementos de una página anterior sin volver a tomar instantánea
  • No manejar la navegación después de acciones de clic
  • Filtrar IDs de sesión o no gestionar el ciclo de vida de la sesión
  • Intentar interactuar con elementos que pueden no ser visibles

Preguntas frecuentes

¿Qué es el sistema de referencias @e?
Los elementos en la página se devuelven con prefijos @e como @e1, @e2. Estas referencias se usan para identificar con qué elemento interactuar. Las referencias cambian después de cada instantánea.
¿Por qué necesito volver a tomar instantánea después de la navegación?
Cuando navegas a una nueva página, el DOM cambia completamente. Las referencias de elementos anteriores se invalidan y se deben obtener nuevas referencias.
¿Puede esta skill evadir páginas de inicio de sesión?
La skill puede automatizar formularios de inicio de sesión pero no puede evadir autenticación. Puede ayudar a mantener sesiones iniciada para operaciones subsequentes.
¿Está la grabación de video siempre habilitada?
No, la grabación de video debe habilitarse explícitamente con record_video: true en la función open. Está desactivada por defecto.
¿Qué opciones de proxy están disponibles?
La skill soporta proxies HTTP, HTTPS y SOCKS5 con autenticación opcional a través de proxy_username y proxy_password.
¿Puedo ejecutar JavaScript personalizado?
Sí, usa la función execute para ejecutar código JavaScript en el contexto del navegador. El resultado se devuelve como una cadena.