computer-use-agents
コンピュータを操作する AI エージェントを構築する
手動によるデスクトップ自動化は反復的で時間がかかります。このスキルでは、画面を観察し、タスクを推論し、コンピュータ使用パターンを使用して自律的にアクションを実行する AI エージェントの構築方法を学べます。
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"computer-use-agents" 사용 중입니다. コンピュータ使用エージェントでスクリーンショットをキャプチャする方法を示してください
예상 결과:
コード例では、pyautogui.screenshot() を使用してスクリーンショットをキャプチャし、トークン効率のために 1280x800 にリサイズし、base64 にエンコードして、分析のためにビジョンモデルに送信する画像データを返す方法を示しています。
"computer-use-agents" 사용 중입니다. コンピュータ使用エージェントを安全に実行するにはどうすればよいですか?
예상 결과:
このスキルでは、非ルートユーザー、読み取り専用ファイルシステム、リソース制限(2 CPU、4GB RAM)、内部ネットワーキング、seccomp プロファイルを備えた完全な Docker 設定を提供します。エージェントは /tmp 内で実行され、ホストの認証情報や機密ディレクトリにアクセスできません。
보안 감사
안전All static analysis findings are false positives. This skill contains educational documentation and code examples for building computer-use agents. The detected patterns (external commands, filesystem access, screen capture) are legitimate code examples demonstrating automation tools like pyautogui and subprocess in Docker-sandboxed environments. The skill explicitly teaches security best practices including sandboxing, resource limits, and credential isolation. No malicious intent or executable code present.
낮은 위험 문제 (3)
품질 점수
만들 수 있는 것
ブラウザテストを自動化する QA エンジニア
Web アプリケーションをナビゲートし、UI 要素を検証し、バグのスクリーンショットをキャプチャするエージェントを構築します。エージェントはユーザーフローをクリックして移動し、期待されるコンテンツをチェックし、視覚的回帰を自動的に報告します。
ビジネスオペレーションのためのデータ入力自動化
API なしでレガシーデスクトップアプリケーション間でデータを転送するエージェントを作成します。エージェントはスプレッドシートから情報を読み取り、対象アプリケーションを開き、キーボードとマウスアクションを通じてデータを入力します。
アクセシビリティテストアシスタント
Web ページを探索してアクセシビリティの問題を特定するエージェントを開発します。人間のユーザーのようにページと対話することで、キーボードナビゲーション、スクリーンリーダーの互換性、色のコントラストをテストします。
이 프롬프트를 사용해 보세요
スクリーンショットを撮影してボタンをクリックできるシンプルな AI エージェントを構築したいです。pyautogui を使用した最小限の Python 例を示し、知覚 - 推論 - アクションループを段階的に説明してください。
コンピュータ使用エージェントを実行するための安全な Docker コンテナの作成を支援してください。仮想ディスプレイ用の Xvfb、観測用の VNC、適切なリソース制限が必要です。セキュリティベストプラクティスを含む Dockerfile と docker-compose.yml を生成してください。
Anthropic API キーがあります。bash ツールとテキストエディタ機能を含む公式 Anthropic SDK を使用して、完全なコンピュータ使用エージェントを実装する方法を示してください。エラーハンドリングとステップ制限を含めてください。
マルチステップワークフローを自動化するエージェントを設計してください:ブラウザを開く、URL に移動する、環境変数から認証情報でログインする、レポートをダウンロードする、特定のディレクトリに保存する。ステップ全体で状態を追跡するためのコンテキスト管理を含めてください。
모범 사례
- コンピュータ使用エージェントは常に、リソース制限がありホスト認証情報にアクセスできない孤立した Docker コンテナ内で実行する
- エージェントループの暴走を防ぐために、ステップ制限(最大 50 反復)とタイムアウトを実装する
- より信頼性の高い自動化のために、マウスクリックではなく可能な限りキーボードショートカットを使用する
피하기
- 実際のファイルや認証情報にアクセスできるホストマシン上でコンピュータ使用エージェントを実行しない
- ハードコードされた認証情報を避ける - 常に環境変数またはシークレット管理ツールを使用する
- テストのためであってもサンドボックスステップをスキップしない - エージェントは意図しないアクションを実行する可能性がある