computer-use-agents
コンピュータを操作する AI エージェントを構築する
手動によるデスクトップ自動化は反復的で時間がかかります。このスキルでは、画面を観察し、タスクを推論し、コンピュータ使用パターンを使用して自律的にアクションを実行する AI エージェントの構築方法を学べます。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "computer-use-agents". コンピュータ使用エージェントでスクリーンショットをキャプチャする方法を示してください
Résultat attendu:
コード例では、pyautogui.screenshot() を使用してスクリーンショットをキャプチャし、トークン効率のために 1280x800 にリサイズし、base64 にエンコードして、分析のためにビジョンモデルに送信する画像データを返す方法を示しています。
Utilisation de "computer-use-agents". コンピュータ使用エージェントを安全に実行するにはどうすればよいですか?
Résultat attendu:
このスキルでは、非ルートユーザー、読み取り専用ファイルシステム、リソース制限(2 CPU、4GB RAM)、内部ネットワーキング、seccomp プロファイルを備えた完全な Docker 設定を提供します。エージェントは /tmp 内で実行され、ホストの認証情報や機密ディレクトリにアクセスできません。
Audit de sécurité
SûrAll static analysis findings are false positives. This skill contains educational documentation and code examples for building computer-use agents. The detected patterns (external commands, filesystem access, screen capture) are legitimate code examples demonstrating automation tools like pyautogui and subprocess in Docker-sandboxed environments. The skill explicitly teaches security best practices including sandboxing, resource limits, and credential isolation. No malicious intent or executable code present.
Problèmes à risque faible (3)
Score de qualité
Ce que vous pouvez construire
ブラウザテストを自動化する QA エンジニア
Web アプリケーションをナビゲートし、UI 要素を検証し、バグのスクリーンショットをキャプチャするエージェントを構築します。エージェントはユーザーフローをクリックして移動し、期待されるコンテンツをチェックし、視覚的回帰を自動的に報告します。
ビジネスオペレーションのためのデータ入力自動化
API なしでレガシーデスクトップアプリケーション間でデータを転送するエージェントを作成します。エージェントはスプレッドシートから情報を読み取り、対象アプリケーションを開き、キーボードとマウスアクションを通じてデータを入力します。
アクセシビリティテストアシスタント
Web ページを探索してアクセシビリティの問題を特定するエージェントを開発します。人間のユーザーのようにページと対話することで、キーボードナビゲーション、スクリーンリーダーの互換性、色のコントラストをテストします。
Essayez ces prompts
スクリーンショットを撮影してボタンをクリックできるシンプルな AI エージェントを構築したいです。pyautogui を使用した最小限の Python 例を示し、知覚 - 推論 - アクションループを段階的に説明してください。
コンピュータ使用エージェントを実行するための安全な Docker コンテナの作成を支援してください。仮想ディスプレイ用の Xvfb、観測用の VNC、適切なリソース制限が必要です。セキュリティベストプラクティスを含む Dockerfile と docker-compose.yml を生成してください。
Anthropic API キーがあります。bash ツールとテキストエディタ機能を含む公式 Anthropic SDK を使用して、完全なコンピュータ使用エージェントを実装する方法を示してください。エラーハンドリングとステップ制限を含めてください。
マルチステップワークフローを自動化するエージェントを設計してください:ブラウザを開く、URL に移動する、環境変数から認証情報でログインする、レポートをダウンロードする、特定のディレクトリに保存する。ステップ全体で状態を追跡するためのコンテキスト管理を含めてください。
Bonnes pratiques
- コンピュータ使用エージェントは常に、リソース制限がありホスト認証情報にアクセスできない孤立した Docker コンテナ内で実行する
- エージェントループの暴走を防ぐために、ステップ制限(最大 50 反復)とタイムアウトを実装する
- より信頼性の高い自動化のために、マウスクリックではなく可能な限りキーボードショートカットを使用する
Éviter
- 実際のファイルや認証情報にアクセスできるホストマシン上でコンピュータ使用エージェントを実行しない
- ハードコードされた認証情報を避ける - 常に環境変数またはシークレット管理ツールを使用する
- テストのためであってもサンドボックスステップをスキップしない - エージェントは意図しないアクションを実行する可能性がある