🌐

agent-browser

Name: agent-browser
Author: toolshell

Riesgo bajo ⚙️ Comandos externos🌐 Acceso a red📁 Acceso al sistema de archivos

Automatización de Navegador para Agentes de IA

También disponible en: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,tul-sh,supercent-io

Permite a los agentes de IA automatizar tareas de navegación web, incluyendo llenado de formularios, extracción de capturas de pantalla y grabación de video a través de una interfaz de línea de comandos simple.

Soporta: Claude Codex Code(CC)

⚠️ 66 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and show elements

Resultado esperado:

Session started with ID: abc123

Interactive elements found:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"

Usando "agent-browser". Take a screenshot of the current page

Resultado esperado:

Screenshot saved to: /tmp/screenshot_20240115_143022.png

Page title: Example Domain
Viewport: 1280x720

Auditoría de seguridad

Riesgo bajo

v1 • 3/8/2026

This is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.

Archivos escaneados

2,312

Líneas analizadas

hallazgos

Auditorías totales

Problemas de riesgo alto (1)

SKILL.md:1-10 templates/authenticated-session.sh:1-50

Heuristic Warning: Browser Automation Capabilities

The skill combines browser automation, network access, and credential handling. This is expected behavior for a browser automation tool and represents legitimate functionality.

Problemas de riesgo medio (1)

SKILL.md:34-60 references/commands.md:1-50

Shell Command Documentation

The skill documentation shows example shell commands using infsh CLI. These are documentation examples, not actual code execution vulnerabilities.

Problemas de riesgo bajo (2)

SKILL.md:9-11

Network Access for Browser Automation

The skill requires network access to navigate websites. This is expected behavior for browser automation.

SKILL.md:67-69

Filesystem Access for Screenshots and Videos

The skill can save screenshots and recordings to filesystem. This is expected functionality for a browser automation tool.

Factores de riesgo

⚙️ Comandos externos (1)

SKILL.md:34-60

🌐 Acceso a red (1)

SKILL.md:9-11

📁 Acceso al sistema de archivos (1)

SKILL.md:67-69

Auditado por: claude

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Pruebas Web Automatizadas

Los agentes de IA pueden navegar a aplicaciones web, llenar formularios de prueba, verificar elementos de UI y capturar resultados de pruebas como capturas de pantalla o video.

Extracción de Datos e Investigación

Extrae datos estructurados de sitios web navegando por páginas, identificando elementos y recopilando información programáticamente.

Flujos de Trabajo de Automatización de Formularios

Automatiza tareas repetitivas de llenado de formularios como entrada de datos, envíos de aplicaciones y operaciones masivas en múltiples páginas.

Prueba estos prompts

Abrir Sitio Web y Obtener Elementos

Usa la habilidad de automatización de navegador para abrir https://example.com y muéstrame todos los elementos interactivos de la página con sus referencias.

Llenar Formulario y Enviar

Navega a la página de inicio de sesión en [URL], llena el campo de correo electrónico con user@example.com, llena el campo de contraseña con mi contraseña, luego haz clic en el botón de envío. Toma una captura de pantalla después del envío.

Extraer Datos de Tabla

Abre la página en [URL], identifica todas las filas de la tabla en la tabla de datos y extrae el contenido de texto de cada fila. Devuelve los datos como una lista estructurada.

Grabar Video de Flujo de Trabajo

Inicia una nueva sesión de navegador con grabación de video habilitada. Navega a través de estos pasos: [list steps], luego cierra la sesión y proporciona la ruta del archivo de video.

Mejores prácticas

Usa referencias de elementos (@e1, @e2) para un direccionamiento confiable de elementos en lugar de selectores CSS
Toma instantáneas después de cada navegación o cambio significativo de página para obtener referencias de elementos frescas
Habilita la grabación de video para depurar flujos de trabajo de automatización complejos
Usa configuración de proxy cuando pruebes contenido con restricciones geográficas o necesites anonimato

Evitar

No confíes en posiciones o coordenadas de elementos - usa refs @e en su lugar para un direccionamiento estable
Evita tiempos de espera largos; usa esperas explícitas para la visibilidad del elemento en lugar de retrasos fijos
No omitas la re-instantánea después de la navegación de página - las referencias de elementos se vuelven obsoletas
Evita subir archivos sensibles sin verificar que el sitio web de destino acepte cargas

Preguntas frecuentes

¿Qué es inference.sh y necesito una cuenta?

Inference.sh es el servicio subyacente que proporciona capacidades de automatización de navegador. Necesitas instalar la CLI de infsh y configurarla con las credenciales de tu cuenta para usar esta habilidad.

¿Puede esta habilidad evadir formularios de inicio de sesión o CAPTCHAs?

No, esta habilidad no puede evadir sistemas de autenticación o CAPTCHAs. Solo puede interactuar con páginas web programáticamente después de que proporciones credenciales o cuando la autenticación ya está manejada.

¿Cómo funcionan las referencias de elementos (@e1, @e2)?

Las referencias de elementos son asignadas por la función de instantánea. Cada vez que llamas a instantánea, obtienes una lista fresca de elementos interactivos con sus prefijos @e. Usa estas referencias en comandos de interacciónsubsequentes.

¿Puedo ejecutar múltiples sesiones de navegador simultáneamente?

Sí, cada sesión tiene un ID de sesión único. Puedes gestionar múltiples sesiones en paralelo usando diferentes identificadores de sesión.

¿Qué navegadores son compatibles?

La habilidad usa Playwright debajo, soportando Chromium, Firefox y WebKit. El predeterminado es Chromium para máxima compatibilidad.

¿Cómo manejo contenido dinámico que carga lentamente?

Usa la acción 'wait' con milisegundos, o usa la opción 'wait_for' en la función de interacción. También puedes ejecutar JavaScript para esperar condiciones específicas.