computer-use-agents
KI-Agenten zum Steuern von Computern erstellen
Manuelle Desktop-Automatisierung ist repetitiv und zeitaufwändig. Diese Anleitung zeigt Ihnen, wie Sie KI-Agenten erstellen, die Bildschirme beobachten, Aufgaben reasoning und autonom mithilfe von Computer-Use-Mustern ausführen.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "computer-use-agents". Zeigen Sie mir, wie man einen Screenshot in einem Computer-Use-Agenten aufnimmt
Résultat attendu:
Das Codebeispiel demonstriert die Aufnahme von Screenshots mit pyautogui.screenshot(), die Größenanpassung auf 1280x800 für Token-Effizienz, die Kodierung in Base64 und die Rückgabe der Bilddaten, um sie an ein Vision-Modell zur Analyse zu senden.
Utilisation de "computer-use-agents". Wie führe ich einen Computer-Use-Agenten sicher aus?
Résultat attendu:
Die Anleitung bietet ein vollständiges Docker-Setup mit einem Nicht-Root-Benutzer, einem schreibgeschützten Dateisystem, Ressourcenlimits (2 CPU, 4GB RAM), internem Networking und seccomp-Profilen. Der Agent läuft in /tmp ohne Zugriff auf Host-Anmeldedaten oder sensible Verzeichnisse.
Audit de sécurité
SûrAll static analysis findings are false positives. This skill contains educational documentation and code examples for building computer-use agents. The detected patterns (external commands, filesystem access, screen capture) are legitimate code examples demonstrating automation tools like pyautogui and subprocess in Docker-sandboxed environments. The skill explicitly teaches security best practices including sandboxing, resource limits, and credential isolation. No malicious intent or executable code present.
Problèmes à risque faible (3)
Score de qualité
Ce que vous pouvez construire
QA-Ingenieur, der Browser-Tests automatisiert
Erstellen Sie einen Agenten, der durch Webanwendungen navigiert, UI-Elemente verifiziert und Screenshots von Fehlern erfasst. Der Agent klickt sich durch Benutzerabläufe, prüft auf erwartete Inhalte und meldet visuelle Regressionen automatisch.
Dateneingabe-Automatisierung für Geschäftsprozesse
Erstellen Sie einen Agenten, der Daten zwischen Legacy-Desktop-Anwendungen ohne APIs überträgt. Der Agent liest Informationen aus Tabellenkalkulationen, öffnet Zielanwendungen und gibt Daten über Tastatur- und Mausaktionen ein.
Barrierefreiheits-Testassistent
Entwickeln Sie einen Agenten, der Webseiten erkundet, um Barrierefreiheitsprobleme zu identifizieren. Er testet Tastaturnavigation, Screenreader-Kompatibilität und Farbkontrast, indem er mit Seiten interagiert wie ein menschlicher Benutzer.
Essayez ces prompts
Ich möchte einen einfachen KI-Agenten erstellen, der Screenshots aufnehmen und auf Buttons klicken kann. Zeigen Sie mir ein minimales Python-Beispiel mit pyautogui und erklären Sie den Perception-Reasoning-Action-Loop Schritt für Schritt.
Helfen Sie mir, einen sicheren Docker-Container für die Ausführung von Computer-Use-Agenten zu erstellen. Ich brauche Xvfb für virtuelle Anzeige, VNC für Beobachtung und geeignete Ressourcenlimits. Generieren Sie ein Dockerfile und docker-compose.yml mit Sicherheits-Best-Practices.
Ich habe einen Anthropic API-Schlüssel. Zeigen Sie mir, wie ich einen vollständigen Computer-Use-Agenten mit dem offiziellen Anthropic SDK mit bash-Tools und Text-Editor-Fähigkeiten implementiere. Fehlerbehandlung und Schrittlimits einschließen.
Entwerfen Sie einen Agenten, der einen Multi-Step-Workflow automatisieren kann: einen Browser öffnen, zu einer URL navigieren, sich mit Anmeldedaten aus Umgebungsvariablen anmelden, einen Bericht herunterladen und ihn in einem bestimmten Verzeichnis speichern. Zustandsverwaltung einschließen, um den Status über Schritte hinweg zu verfolgen.
Bonnes pratiques
- Führen Sie Computer-Use-Agenten immer in isolierten Docker-Containern mit Ressourcenlimits und ohne Zugriff auf Host-Anmeldedaten aus
- Implementieren Sie Schrittlimits (max. 50 Iterationen) und Timeouts, um unkontrollierte Agenten-Schleifen zu verhindern
- Verwenden Sie Tastenkombinationen anstelle von Mausklicks, wenn möglich, für zuverlässigere Automatisierung
Éviter
- Führen Sie Computer-Use-Agenten niemals auf Ihrem Host-Computer mit Zugriff auf echte Dateien und Anmeldedaten aus
- Vermeiden Sie hartcodierte Anmeldedaten - verwenden Sie immer Umgebungsvariablen oder Secret-Management-Tools
- Überspringen Sie den Sandbox-Schritt nicht einmal zum Testen - Agenten können unbeabsichtigte Aktionen ausführen