Habilidades agent-browser
🌐

agent-browser

Seguro ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatizar Tareas del Navegador con Agentes de IA

También disponible en: vercel-labs,inference-sh-0,inferencesh,inf-sh

Esta habilidad permite a los agentes de IA automatizar navegadores web para tareas como extracción de datos web, llenado de formularios y pruebas a través de un sistema @e ref simple.

Soporta: Claude Codex Code(CC)
🥉 76 Bronce
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Abrir https://example.com y obtener referencias de elementos

Resultado esperado:

Sesión iniciada con ID: abc123. Elementos encontrados: @e1 [a] "Home", @e2 [a] "About", @e3 [a] "Contact", @e4 [p] "Welcome to Example Domain"

Usando "agent-browser". Llenar y enviar formulario de contacto

Resultado esperado:

Se llenó exitosamente @e1 con "John Doe", @e2 con "john@example.com", @e3 con "Hello". Se hizo clic en @e4. Formulario enviado exitosamente.

Auditoría de seguridad

Seguro
v1 • 2/25/2026

This is a legitimate browser automation skill using inference.sh CLI with Playwright. All 609 static findings are false positives - they detect patterns in documentation code blocks (shell command substitution examples, example URLs, placeholder paths) rather than actual executable code. The skill provides proper security best practices including credential handling via environment variables.

10
Archivos escaneados
2,312
Líneas analizadas
3
hallazgos
1
Auditorías totales

Factores de riesgo

⚙️ Comandos externos (1)
🌐 Acceso a red (1)
📁 Acceso al sistema de archivos (1)
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
50
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Extracción de Datos Web

Automatizar la extracción de datos estructurados desde sitios web navegando páginas, interactuando con elementos y capturando contenido.

Llenado Automático de Formularios

Automatizar el envío de formularios repetitivos como formularios de contacto, encuestas o tareas de entrada de datos a través de múltiples páginas.

Gestión de Sesiones Autenticadas

Iniciar sesión una vez y reutilizar sesiones autenticadas para tareas repetitivas como monitorear dashboards o extraer contenido específico del usuario.

Prueba estos prompts

Abrir y Snapshot
Usar la habilidad agent-browser para abrir https://example.com y obtener las referencias de elementos.
Envío de Formulario
Navegar a la página de login, llenar los campos de email y contraseña usando refs de elementos, y enviar el formulario. Luego verificar el éxito del login.
Extracción de Datos con Captura
Abrir la página, tomar una captura de pantalla de página completa, extraer todo el contenido de texto de los elementos, y guardar los resultados.
Flujo de Trabajo Autenticado
Crear una nueva sesión, iniciar sesión en la aplicación con credenciales de variables de entorno, navegar al dashboard, extraer datos específicos, y mantener la sesión abierta para reutilización.

Mejores prácticas

  • Siempre volver a tomar snapshot después de navegación o envíos de formulario para obtener refs de elementos frescos
  • Usar variables de entorno para credenciales en lugar de hardcodearlas
  • Habilitar grabación de video solo durante depuración - puede capturar datos sensibles
  • Implementar manejo de errores y verificar que las acciones se completaron con éxito antes de continuar

Evitar

  • Asumir que las refs de elementos persisten a través de navegación de página sin volver a tomar snapshot
  • Hardcodear credenciales en scripts en lugar de usar variables de entorno
  • No verificar el éxito del login - siempre verificar que se llegó a la página esperada
  • Dejar sesiones abiertas indefinidamente - siempre cerrar o implementar limpieza apropiada

Preguntas frecuentes

¿Qué es la invalidación de refs de elementos?
Después de navegar a una nueva página o enviar formularios, todas las refs @e se vuelven inválidas. Debes llamar a snapshot nuevamente para obtener nuevas refs para el estado actual de la página.
¿Cómo manejo 2FA durante el login?
Habilitar grabación de video para ver el prompt de 2FA, luego usar herramientas de generación TOTP o pausar para ingresar manualmente el código desde stdin.
¿Puedo reutilizar sesiones autenticadas?
Sí, las sesiones mantienen cookies y estado. Iniciar con --session new, luego usar el session_id devuelto para llamadas subsecuentes. No llamar a close si se desea reutilizar.
¿Qué proxies están soportados?
Los proxies HTTP, HTTPS y SOCKS5 están soportados. Configurar proxy_url, proxy_username y proxy_password en el input de la función open.
¿Cómo tomo una captura de pantalla de página completa?
Usar la función screenshot con full_page: true. Para páginas muy largas, esto captura toda el área desplazable.
¿Es segura esta habilidad para uso en producción?
Sí, pero seguir mejores prácticas de seguridad: usar variables de entorno para credenciales, deshabilitar grabación de video en producción, e implementar limpieza apropiada de sesiones.