computer-use-agents
Construir agentes de IA que controlan ordenadores
La automatización manual del escritorio es repetitiva y consume mucho tiempo. Esta habilidad te enseña a construir agentes de IA que observan pantallas, razonan sobre tareas y ejecutan acciones de forma autónoma utilizando patrones de uso de ordenador.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "computer-use-agents". Show me how to capture a screenshot in a computer use agent
Résultat attendu:
El ejemplo de código demuestra la captura de pantallas usando pyautogui.screenshot(), redimensionando a 1280x800 para eficiencia de tokens, codificando a base64 y devolviendo los datos de imagen para enviar a un modelo de visión para análisis.
Utilisation de "computer-use-agents". How do I safely run a computer use agent?
Résultat attendu:
La habilidad proporciona una configuración completa de Docker con usuario no-root, sistema de archivos de solo lectura, límites de recursos (2 CPU, 4GB RAM), red interna y perfiles seccomp. El agente se ejecuta en /tmp sin acceso a credenciales del host o directorios sensibles.
Audit de sécurité
SûrAll static analysis findings are false positives. This skill contains educational documentation and code examples for building computer-use agents. The detected patterns (external commands, filesystem access, screen capture) are legitimate code examples demonstrating automation tools like pyautogui and subprocess in Docker-sandboxed environments. The skill explicitly teaches security best practices including sandboxing, resource limits, and credential isolation. No malicious intent or executable code present.
Problèmes à risque faible (3)
Score de qualité
Ce que vous pouvez construire
Ingeniero QA automatizando pruebas de navegador
Construir un agente que navegue por aplicaciones web, verifique elementos UI y capture capturas de pantalla de errores. El agente hace clic a través de flujos de usuario, verifica el contenido esperado e informa de regresiones visuales automáticamente.
Automatización de entrada de datos para operaciones empresariales
Crear un agente que transfiera datos entre aplicaciones de escritorio heredadas sin API. El agente lee información de hojas de cálculo, abre las aplicaciones objetivo e introduce datos mediante acciones de teclado y ratón.
Asistente de pruebas de accesibilidad
Desarrollar un agente que explore páginas web para identificar problemas de accesibilidad. Prueba la navegación con teclado, compatibilidad con lectores de pantalla y contraste de colores interactuando con las páginas como lo haría un usuario humano.
Essayez ces prompts
Quiero construir un simple agente de IA que pueda tomar capturas de pantalla y hacer clic en botones. Muéstrame un ejemplo mínimo en Python usando pyautogui y explica el bucle percepción-razonamiento-acción paso a paso.
Ayúdame a crear un contenedor Docker seguro para ejecutar agentes de uso de ordenador. Necesito Xvfb para visualización virtual, VNC para observación y límites de recursos adecuados. Genera un Dockerfile y docker-compose.yml con mejores prácticas de seguridad.
Tengo una clave API de Anthropic. Muéstrame cómo implementar un agente completo de uso de ordenador usando el SDK oficial de Anthropic con herramientas bash y capacidades de editor de texto. Incluye manejo de errores y límites de pasos.
Diseña un agente que pueda automatizar un flujo de trabajo multipaso: abrir un navegador, navegar a una URL, iniciar sesión con credenciales de variables de entorno, descargar un informe y guardarlo en un directorio específico. Incluye gestión de contexto para rastrear el estado entre pasos.
Bonnes pratiques
- Siempre ejecuta agentes de uso de ordenador en contenedores Docker aislados con límites de recursos y sin acceso a credenciales del host
- Implementa límites de pasos (máximo 50 iteraciones) y tiempos de espera para evitar bucles de agente descontrolados
- Usa atajos de teclado en lugar de clics de ratón cuando sea posible para una automatización más fiable
Éviter
- Nunca ejecutes agentes de uso de ordenador en tu máquina host con acceso a archivos reales y credenciales
- Evita credenciales hardcodeadas - siempre usa variables de herramientas de gestión de secretos
- No omitas el paso de sandboxing incluso para pruebas - los agentes pueden ejecutar acciones no deseadas