gemini-computer-use
Automatizar tareas del navegador con Gemini AI
Esta habilidad permite a los agentes de IA controlar navegadores web para tareas automatizadas como completado de formularios, extracción de datos y pruebas web a través del modelo Gemini 2.5 Computer Use con Playwright.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "gemini-computer-use". python scripts/computer_use_agent.py --prompt 'Find the heading on example.com' --start-url 'https://example.com'
Resultado esperado:
El agente navega a example.com, captura la captura de pantalla, la IA la analiza y devuelve: 'El encabezado principal es: Example Domain'
Usando "gemini-computer-use". python scripts/computer_use_agent.py --prompt 'Click the login button' --start-url 'https://mysite.com'
Resultado esperado:
El agente identifica el botón de inicio de sesión desde la captura de pantalla, ejecuta la acción de clic, devuelve la captura de pantalla actualizada mostrando el formulario de inicio de sesión
Auditoría de seguridad
SeguroAll 52 static findings are false positives. The skill is a legitimate browser automation tool using Gemini 2.5 Computer Use API with Playwright. Environment variable access is secure (API keys via os.getenv), network calls are to Google's legitimate API, and external command patterns are documentation examples in markdown/code blocks.
Problemas de riesgo alto (1)
Problemas de riesgo medio (1)
Problemas de riesgo bajo (1)
Factores de riesgo
🌐 Acceso a red (2)
⚙️ Comandos externos (1)
Puntuación de calidad
Lo que puedes crear
Completado automático de formularios web
Complete formularios automáticamente proporcionando la URL objetivo y los valores de campo al agente de IA.
Extracción de datos web
Navegue por sitios web y extraiga datos estructurados basándose en la comprensión de IA del contenido de la página.
Pruebas basadas en navegador
Ejecute pruebas automatizadas de navegador que pueden adaptarse a cambios de UI usando interpretación de IA.
Prueba estos prompts
Navega a {url} y dime el título del encabezado principal de la página.Ve a {url}, completa el campo de correo electrónico con {email} y haz clic en el botón de envío. Reporta cualquier mensaje de éxito.Busca {query} en {search_engine}, haz clic en el primer resultado y extrae el correo electrónico de contacto si está visible.Navega a {url}, desplázate por la página y lista todos los nombres de productos y precios en formato de tabla.Mejores prácticas
- Ejecutar en un perfil de navegador sandboxed o contenedor para aislar de datos sensibles
- Usar el parámetro --exclude para bloquear acciones riesgosas como descargas de archivos
- Configurar límites de turnos para prevenir bucles descontrolados del agente
Evitar
- No proporcionar credenciales reales a la IA sin confirmación del usuario
- Evitar ejecutar en sitios web de producción sin limitación de tasa
- No depender únicamente de IA para transacciones financieras críticas