agent-browser
Automatizar tareas del navegador con agentes de IA
También disponible en: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh
Los agentes de IA necesitan interactuar con páginas web pero carecen de capacidades de navegador. Esta habilidad proporciona automatización de navegador sin cabeza a través de comandos de shell simples, permitiendo web scraping, llenado de formularios y flujos de trabajo de pruebas automatizadas.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "agent-browser". Abrir example.com y listar elementos clickeables
Resultado esperado:
Sesión iniciada: abc123
URL: https://example.com
Título: Example Domain
Elementos clickeables:
- @e1 [a] 'Más información...' href='https://example.com/about'
- @e2 [a] 'Dominios' href='https://example.com/domains'
- @e3 [button] 'Comenzar'
- @e4 [input type='email'] placeholder='Ingresa tu email'
Captura de pantalla guardada en: ./screenshots/example.com_20240101.png
Usando "agent-browser". Llenar formulario de inicio de sesión y verificar éxito
Resultado esperado:
Flujo de inicio de sesión completado:
1. Página de inicio de sesión abierta
2. Campo de email llenado con user@example.com
3. Campo de contraseña llenado
4. Botón de Iniciar sesión hecho clic
5. Esperé la redirección
6. Verifiqué que la URL cambió de /login a /dashboard
7. Capturé captura de pantalla del dashboard
ID de sesión: abc123 (activo)
Captura de pantalla: ./screenshots/dashboard_20240101.png
Auditoría de seguridad
Riesgo medioStatic analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.
Problemas de riesgo medio (4)
Factores de riesgo
⚙️ Comandos externos (4)
🌐 Acceso a red (3)
📁 Acceso al sistema de archivos (2)
Puntuación de calidad
Lo que puedes crear
Extracción de datos web para investigación
Extraer datos estructurados de sitios web navegando por páginas, llenando formularios de búsqueda y recopilando contenido de páginas. Útil para investigación de mercado, análisis de competidores y tareas de recopilación de datos.
Flujos de trabajo automatizados de envío de formularios
Automatizar tareas repetitivas de llenado de formularios como solicitudes de empleo, finalización de encuestas o entrada de datos. Manejar formularios de múltiples pasos con navegación condicional y verificación.
Pruebas de API basadas en navegador
Probar aplicaciones web que requieren contexto de navegador, como SPAs con autenticación del lado del cliente o flujos de trabajo intensivos en JavaScript. Capturar capturas de pantalla y video para documentación.
Prueba estos prompts
Usar la habilidad agent-browser para abrir https://example.com, tomar una captura de pantalla y listar todos los elementos clickeables en la página.
Usar agent-browser para iniciar sesión en https://app.example.com con el email user@example.com y la contraseña de la variable de entorno PASSWORD. Después de iniciar sesión, verificar que se puede acceder a la página del dashboard y tomar una captura de pantalla.
Crear un script usando agent-browser para llenar un formulario de registro de múltiples pasos: abrir el formulario, llenar el paso 1 con nombre y email, proceder al paso 2, llenar los detalles de dirección, enviar y verificar el mensaje de éxito.
Usar agent-browser para abrir tres páginas de productos diferentes en sesiones paralelas, extraer precios y disponibilidad de cada una, y cerrar todas las sesiones. Comparar los datos recopilados.
Mejores prácticas
- Siempre usar variables de entorno para datos sensibles como contraseñas en lugar de hardcodear credenciales en scripts
- Volver a capturar la página después de cualquier navegación o cambios en el DOM para obtener referencias frescas de elementos antes de interactuar
- Habilitar la grabación de video solo durante la depuración para evitar capturar información sensible en producción
Evitar
- No hardcodear contraseñas o claves API directamente en scripts o argumentos de comandos
- No omitir el paso de snapshot después de la navegación de página - las referencias de elementos obsoletas causarán fallos
- No dejar sesiones abiertas innecesariamente - siempre cerrar sesiones cuando se termine para liberar recursos