agent-browser
Automatizar Navegación Web con Agentes IA
También disponible en: vercel-labs,inferencesh,inference-sh-9,inference-sh-8,inf-sh,inference-sh-0
Automatiza interacciones web como llenado de formularios, extracción de datos y pruebas sin control manual del navegador. Esta habilidad proporciona a los agentes IA capacidades de automatización del navegador a través de un simple sistema de referencia de elementos, eliminando la necesidad de selectores complejos o consultas XPath.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "agent-browser". Open https://example.com and show me interactive elements
Resultado esperado:
Session created: abc123
Interactive elements:
@e1 [a] 'Home' href='/'
@e2 [input type='text'] placeholder='Search'
@e3 [button] 'Submit'
Screenshot saved to: /tmp/screenshot.png
Usando "agent-browser". Click the search button and wait for results
Resultado esperado:
Action completed: clicked @e3
Waiting for page load...
Snapshot updated: 5 new elements found
Current URL: https://example.com/search?q=test
Usando "agent-browser". Extract all headlines from the page
Resultado esperado:
Executing JavaScript: document.querySelectorAll('h2').map(h => h.textContent)
Result: ['Introduction', 'Features', 'Pricing', 'Contact']
Screenshot saved
Auditoría de seguridad
SeguroAll 606 static findings are false positives. The skill contains only documentation (markdown files) and template shell scripts. The external_commands findings are code examples in markdown showing users how to use the infsh CLI tool. The network findings are example URLs in documentation. The filesystem findings are example file paths. The skill itself does not execute any commands - it provides documentation for a third-party CLI tool (inference.sh). Users execute the commands themselves, not the skill.
Factores de riesgo
⚙️ Comandos externos (3)
🌐 Acceso a red (2)
📁 Acceso al sistema de archivos (2)
Puntuación de calidad
Lo que puedes crear
Pruebas Automatizadas de Formularios
Los ingenieros de QA pueden automatizar flujos de envío de formularios en múltiples navegadores, probando lógica de validación y manejo de errores sin clics manuales
Extracción de Datos de Aplicaciones Web
Los investigadores pueden extraer datos estructurados de aplicaciones web que requieren inicio de sesión, navegando a través de sesiones autenticadas para raspar informes o paneles
Pruebas de Regresión
Los desarrolladores pueden crear scripts de automatización de navegador reproducibles para verificar flujos críticos de usuario como procesos de pago o registro de cuentas después de cambios de código
Prueba estos prompts
Open https://example.com and show me all interactive elements on the page
Fill in the login form with username 'user@example.com' and password 'secret123', then click the submit button
Navigate to https://example.com/data and execute JavaScript to extract all product names and prices into a structured format
Open a browser session with video recording enabled, navigate through the checkout flow, and save the video for debugging
Mejores prácticas
- Siempre vuelve a capturar después de la navegación de la página para obtener referencias de elementos frescas, ya que las refs @e se invalidan cuando el DOM cambia
- Usa variables de entorno para credenciales sensibles en lugar de codificarlas en scripts de automatización
- Cierra las sesiones del navegador cuando termines para liberar recursos y recuperar los videos grabados
- Comienza con la grabación de video habilitada durante el desarrollo, luego desactívala para ejecuciones de producción para mejorar el rendimiento
Evitar
- No reutilices referencias de elementos después de hacer clic en enlaces o enviar formularios - siempre llama a snapshot para obtener nuevas refs
- Evita sesiones largas sin actividad - las sesiones pueden expirar y perder estado
- Nunca cometan credenciales o claves API en scripts de automatización que usen esta habilidad
- No intentes interactuar con elementos antes de que sean visibles en el viewport