Habilidades agent-browser
📦

agent-browser

Riesgo bajo ⚙️ Comandos externos🌐 Acceso a red

Automatiza Flujos de Trabajo del Navegador con Agentes de IA

También disponible en: inference-sh-9,inferen-sh,inference-shell,inf-sh,toolshell,inference-sh-8,inferencesh,skillssh,inference-sh-0,tul-sh,vercel-labs

Las pruebas manuales web y la automatización del navegador requieren scripts complejos y selectores frágiles. Esta skill proporciona control determinista del navegador usando referencias de elementos basadas en instantáneas para flujos de trabajo confiables y repetibles.

Soporta: Claude Codex Code(CC)
📊 71 Adecuado
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". agent-browser open https://example.com && agent-browser snapshot -i

Resultado esperado:

  • Página abierta exitosamente
  • Instantánea del árbol de accesibilidad capturada
  • Elementos interactivos: @e1 (Campo de búsqueda), @e2 (Botón de enviar), @e3 (Enlace de navegación)

Usando "agent-browser". agent-browser diff screenshot --baseline baseline.png

Resultado esperado:

  • Regresión visual completada
  • 3 regiones cambiadas detectadas
  • Diferencias resaltadas en imagen de salida anotada

Auditoría de seguridad

Riesgo bajo
v1 • 3/20/2026

Static analyzer flagged 80 external_commands and 10 network patterns, but all are FALSE POSITIVES. The patterns appear in documentation files (.md) showing CLI usage examples, not executable code. The skill is a legitimate browser automation tool with built-in security features including domain allowlists, action policies, and environment variable-based credential management. No malicious intent detected.

8
Archivos escaneados
383
Líneas analizadas
3
hallazgos
1
Auditorías totales
Problemas de riesgo bajo (1)
External Command Documentation Patterns
Static analyzer detected shell command patterns in markdown files. After review, these are documentation examples for a CLI tool, not executable code. The skill teaches users how to use the agent-browser CLI safely.

Factores de riesgo

⚙️ Comandos externos (1)
🌐 Acceso a red (1)
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
25
Comunidad
88
Seguridad
100
Cumplimiento de la especificación

Lo que puedes crear

Pruebas de Aplicaciones Web

Verificar cambios de UI, probar envíos de formularios y validar flujos de usuarios con referencias de elementos deterministas que sobreviven a las actualizaciones del DOM.

Extracción Automatizada de Datos

Navegar a sitios web, extraer contenido estructurado usando instantáneas limitadas y capturar resultados como capturas de pantalla o datos estructurados.

Monitoreo de Regresión Visual

Capturar capturas de pantalla base, automatizar interacciones de usuarios y detectar cambios visuales con reportes de diferencias anotadas.

Prueba estos prompts

Navegación Básica de Página
Open https://example.com, wait for the page to load, and show me the accessibility snapshot with element references.
Automatización de Formularios
Navigate to the login page, wait for network idle, snapshot the page, fill the email and password fields using refs, click submit, and verify the dashboard loaded.
Prueba de Regresión Visual
Take a baseline screenshot, perform the checkout flow, then compare the final state against the baseline and report any visual differences.
Flujo de Trabajo de Sesión Paralela
Open two isolated sessions: one for research on example.com and one for shopping on shop.example.com. Run both workflows concurrently and close both sessions when complete.

Mejores prácticas

  • Siempre tomar nueva instantánea después de navegación o cambios del DOM antes de usar referencias de elementos
  • Usar esperas explícitas (networkidle, selector, ref) en lugar de delays de sueño fijos
  • Usar sesiones nombradas para flujos de trabajo paralelos y cerrarlas al completar la tarea

Evitar

  • Reutilizar refs obsoletas después de navegación de página o actualizaciones significativas del DOM
  • Incrustar credenciales directamente en scripts en lugar de usar variables de entorno
  • Omitir la limpieza de sesiones que puede causar fugas de recursos y colisiones de cookies

Preguntas frecuentes

¿Por qué las refs de elementos se vuelven inválidas?
Las refs se generan desde la instantánea del árbol de accesibilidad. Cualquier navegación, envío de formulario con rerenderizado o reconstrucción del DOM invalida la estructura del árbol, haciendo que las refs antiguas apunten a elementos incorrectos o inexistentes.
¿Cómo manejo flujos de trabajo de autenticación?
Usar variables de entorno para credenciales, realizar login una vez, guardar el estado de sesión con 'state save', y recargarlo en ejecuciones posteriores para evitar autenticación repetida.
¿Puedo ejecutar múltiples sesiones de navegador simultáneamente?
Sí, usa la bandera --session con nombres únicos para cada tarea concurrente. Esto aísla cookies, localStorage y contexto del navegador entre sesiones.
¿Qué opciones de endurecimiento de seguridad están disponibles?
Usa AGENT_BROWSER_ALLOWED_DOMAINS para listado de dominios permitidos, AGENT_BROWSER_ACTION_POLICY para restricciones de acciones, y AGENT_BROWSER_CONTENT_BOUNDARIES para reducir el riesgo de inyección de prompts.
¿Cómo depuro cuando una interacción falla?
Ejecutar snapshot -i de nuevo para obtener refs frescas, verificar que el texto de etiqueta del elemento coincida con tu objetivo, y usar comandos de espera para contenido dinámico antes de interactuar.
¿Cuál es el patrón de encadenamiento de comandos recomendado?
Usar encadenamiento con && para secuencias simples donde no se necesita salida intermedia. Separar comandos cuando necesites analizar salida o refs antes de la siguiente acción.