Habilidades agent-browser
🌐

agent-browser

Seguro ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatizar Navegación Web con Agentes IA

También disponible en: vercel-labs,inferencesh,inference-sh-9,inference-sh-8,inf-sh,inference-sh-0

Automatiza interacciones web como llenado de formularios, extracción de datos y pruebas sin control manual del navegador. Esta habilidad proporciona a los agentes IA capacidades de automatización del navegador a través de un simple sistema de referencia de elementos, eliminando la necesidad de selectores complejos o consultas XPath.

Soporta: Claude Codex Code(CC)
🥉 76 Bronce
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and show me interactive elements

Resultado esperado:

Session created: abc123

Interactive elements:
@e1 [a] 'Home' href='/'
@e2 [input type='text'] placeholder='Search'
@e3 [button] 'Submit'

Screenshot saved to: /tmp/screenshot.png

Usando "agent-browser". Click the search button and wait for results

Resultado esperado:

Action completed: clicked @e3
Waiting for page load...
Snapshot updated: 5 new elements found

Current URL: https://example.com/search?q=test

Usando "agent-browser". Extract all headlines from the page

Resultado esperado:

Executing JavaScript: document.querySelectorAll('h2').map(h => h.textContent)

Result: ['Introduction', 'Features', 'Pricing', 'Contact']
Screenshot saved

Auditoría de seguridad

Seguro
v1 • 3/5/2026

All 606 static findings are false positives. The skill contains only documentation (markdown files) and template shell scripts. The external_commands findings are code examples in markdown showing users how to use the infsh CLI tool. The network findings are example URLs in documentation. The filesystem findings are example file paths. The skill itself does not execute any commands - it provides documentation for a third-party CLI tool (inference.sh). Users execute the commands themselves, not the skill.

10
Archivos escaneados
2,312
Líneas analizadas
3
hallazgos
1
Auditorías totales
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
50
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Pruebas Automatizadas de Formularios

Los ingenieros de QA pueden automatizar flujos de envío de formularios en múltiples navegadores, probando lógica de validación y manejo de errores sin clics manuales

Extracción de Datos de Aplicaciones Web

Los investigadores pueden extraer datos estructurados de aplicaciones web que requieren inicio de sesión, navegando a través de sesiones autenticadas para raspar informes o paneles

Pruebas de Regresión

Los desarrolladores pueden crear scripts de automatización de navegador reproducibles para verificar flujos críticos de usuario como procesos de pago o registro de cuentas después de cambios de código

Prueba estos prompts

Abrir Página Web
Open https://example.com and show me all interactive elements on the page
Llenar y Enviar Formulario
Fill in the login form with username 'user@example.com' and password 'secret123', then click the submit button
Extraer Datos con JavaScript
Navigate to https://example.com/data and execute JavaScript to extract all product names and prices into a structured format
Grabar Video de Depuración
Open a browser session with video recording enabled, navigate through the checkout flow, and save the video for debugging

Mejores prácticas

  • Siempre vuelve a capturar después de la navegación de la página para obtener referencias de elementos frescas, ya que las refs @e se invalidan cuando el DOM cambia
  • Usa variables de entorno para credenciales sensibles en lugar de codificarlas en scripts de automatización
  • Cierra las sesiones del navegador cuando termines para liberar recursos y recuperar los videos grabados
  • Comienza con la grabación de video habilitada durante el desarrollo, luego desactívala para ejecuciones de producción para mejorar el rendimiento

Evitar

  • No reutilices referencias de elementos después de hacer clic en enlaces o enviar formularios - siempre llama a snapshot para obtener nuevas refs
  • Evita sesiones largas sin actividad - las sesiones pueden expirar y perder estado
  • Nunca cometan credenciales o claves API en scripts de automatización que usen esta habilidad
  • No intentes interactuar con elementos antes de que sean visibles en el viewport

Preguntas frecuentes

¿Necesito instalar algo para usar esta habilidad?
Sí, necesitas tener instalada la herramienta CLI inference.sh (infsh). Ejecuta 'npx skills add inference-sh/skills@agent-tools' para ver las instrucciones de instalación.
¿Qué sucede con mis referencias de elementos después de hacer clic en un enlace?
Las referencias de elementos (@e) se invalidan después de cualquier navegación o cambio del DOM. Siempre llama a la función snapshot para obtener referencias frescas después de la navegación.
¿Puedo usar esto para extraer datos de sitios web?
Sí, puedes navegar a páginas, ejecutar JavaScript para extraer datos y tomar capturas de pantalla. La habilidad soporta sesiones autenticadas para raspar contenido protegido.
¿Cómo manejo formularios de inicio de sesión con autenticación de dos factores?
La habilidad soporta intervención manual para 2FA - puedes pausar la automatización para ingresar códigos, o usar herramientas TOTP para generar códigos programáticamente. Ver authentication.md para ejemplos.
¿Mi actividad de navegación es privada?
La habilidad usa el servicio inference.sh para ejecutar comandos del navegador. Revisa su política de privacidad para detalles sobre el manejo de datos. Usa el soporte de proxy para privacidad adicional.
¿Puedo ejecutar múltiples sesiones de navegador en paralelo?
Sí, cada sesión tiene un session_id único. Puedes crear múltiples sesiones y ejecutarlas concurrentemente para pruebas paralelas o extracción de datos.