Habilidades agent-browser
🌐

agent-browser

Riesgo bajo ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatización de Navegador para Agentes de IA

También disponible en: inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,skillssh,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

Permite a los agentes de IA automatizar tareas de navegación web, incluyendo llenado de formularios, extracción de capturas de pantalla y grabación de video a través de una interfaz de línea de comandos simple.

Soporta: Claude Codex Code(CC)
⚠️ 67 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and show elements

Resultado esperado:

Session started with ID: abc123

Interactive elements found:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"

Usando "agent-browser". Take a screenshot of the current page

Resultado esperado:

Screenshot saved to: /tmp/screenshot_20240115_143022.png

Page title: Example Domain
Viewport: 1280x720

Auditoría de seguridad

Riesgo bajo
v1 • 3/8/2026

This is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.

10
Archivos escaneados
2,312
Líneas analizadas
7
hallazgos
1
Auditorías totales

Problemas de riesgo alto (1)

Heuristic Warning: Browser Automation Capabilities
The skill combines browser automation, network access, and credential handling. This is expected behavior for a browser automation tool and represents legitimate functionality.
Problemas de riesgo medio (1)
Shell Command Documentation
The skill documentation shows example shell commands using infsh CLI. These are documentation examples, not actual code execution vulnerabilities.
Problemas de riesgo bajo (2)
Network Access for Browser Automation
The skill requires network access to navigate websites. This is expected behavior for browser automation.
Filesystem Access for Screenshots and Videos
The skill can save screenshots and recordings to filesystem. This is expected functionality for a browser automation tool.

Factores de riesgo

⚙️ Comandos externos (1)
🌐 Acceso a red (1)
📁 Acceso al sistema de archivos (1)
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
25
Comunidad
71
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Pruebas Web Automatizadas

Los agentes de IA pueden navegar a aplicaciones web, llenar formularios de prueba, verificar elementos de UI y capturar resultados de pruebas como capturas de pantalla o video.

Extracción de Datos e Investigación

Extrae datos estructurados de sitios web navegando por páginas, identificando elementos y recopilando información programáticamente.

Flujos de Trabajo de Automatización de Formularios

Automatiza tareas repetitivas de llenado de formularios como entrada de datos, envíos de aplicaciones y operaciones masivas en múltiples páginas.

Prueba estos prompts

Abrir Sitio Web y Obtener Elementos
Usa la habilidad de automatización de navegador para abrir https://example.com y muéstrame todos los elementos interactivos de la página con sus referencias.
Llenar Formulario y Enviar
Navega a la página de inicio de sesión en [URL], llena el campo de correo electrónico con user@example.com, llena el campo de contraseña con mi contraseña, luego haz clic en el botón de envío. Toma una captura de pantalla después del envío.
Extraer Datos de Tabla
Abre la página en [URL], identifica todas las filas de la tabla en la tabla de datos y extrae el contenido de texto de cada fila. Devuelve los datos como una lista estructurada.
Grabar Video de Flujo de Trabajo
Inicia una nueva sesión de navegador con grabación de video habilitada. Navega a través de estos pasos: [list steps], luego cierra la sesión y proporciona la ruta del archivo de video.

Mejores prácticas

  • Usa referencias de elementos (@e1, @e2) para un direccionamiento confiable de elementos en lugar de selectores CSS
  • Toma instantáneas después de cada navegación o cambio significativo de página para obtener referencias de elementos frescas
  • Habilita la grabación de video para depurar flujos de trabajo de automatización complejos
  • Usa configuración de proxy cuando pruebes contenido con restricciones geográficas o necesites anonimato

Evitar

  • No confíes en posiciones o coordenadas de elementos - usa refs @e en su lugar para un direccionamiento estable
  • Evita tiempos de espera largos; usa esperas explícitas para la visibilidad del elemento en lugar de retrasos fijos
  • No omitas la re-instantánea después de la navegación de página - las referencias de elementos se vuelven obsoletas
  • Evita subir archivos sensibles sin verificar que el sitio web de destino acepte cargas

Preguntas frecuentes

¿Qué es inference.sh y necesito una cuenta?
Inference.sh es el servicio subyacente que proporciona capacidades de automatización de navegador. Necesitas instalar la CLI de infsh y configurarla con las credenciales de tu cuenta para usar esta habilidad.
¿Puede esta habilidad evadir formularios de inicio de sesión o CAPTCHAs?
No, esta habilidad no puede evadir sistemas de autenticación o CAPTCHAs. Solo puede interactuar con páginas web programáticamente después de que proporciones credenciales o cuando la autenticación ya está manejada.
¿Cómo funcionan las referencias de elementos (@e1, @e2)?
Las referencias de elementos son asignadas por la función de instantánea. Cada vez que llamas a instantánea, obtienes una lista fresca de elementos interactivos con sus prefijos @e. Usa estas referencias en comandos de interacciónsubsequentes.
¿Puedo ejecutar múltiples sesiones de navegador simultáneamente?
Sí, cada sesión tiene un ID de sesión único. Puedes gestionar múltiples sesiones en paralelo usando diferentes identificadores de sesión.
¿Qué navegadores son compatibles?
La habilidad usa Playwright debajo, soportando Chromium, Firefox y WebKit. El predeterminado es Chromium para máxima compatibilidad.
¿Cómo manejo contenido dinámico que carga lentamente?
Usa la acción 'wait' con milisegundos, o usa la opción 'wait_for' en la función de interacción. También puedes ejecutar JavaScript para esperar condiciones específicas.