agent-browser
AIエージェントでブラウザタスクを自動化
こちらからも入手できます: inference-sh-8,vercel-labs,inferencesh,inf-sh
このスキルは、シンプルな@e参照システムを通じて、AIエージェントがナビゲーション、フォーム入力、データ抽出、ビジュ��ル録画などのブラウザ操作を自動化できるようにします。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「agent-browser」を使用しています。 https://example.com を開いて要素を取得
期待される結果:
セッションがID: abc123で開始されました。検出された要素: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."
「agent-browser」を使用しています。 ログインフォームに入力して送信
期待される結果:
@e1 に 'user@example.com' を入力、@e2 に 'password123' を入力、@e3 をクリック。ナビゲーションを検出。再スナップショットを推奨。
「agent-browser」を使用しています。 スクリーンショットを撮影
期待される結果:
スクリーンショットをキャプチャ: {base64エンコードされた画像データ}, サイズ: 1920x1080
セキュリティ監査
低リスクThis is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.
低リスクの問題 (3)
リスク要因
⚙️ 外部コマンド (5)
🌐 ネットワークアクセス (2)
📁 ファイルシステムへのアクセス (1)
品質スコア
作れるもの
自動フォーム送信
データ入力自動化のためにウェブフォームをプログラムで入力・送信
ウェブコンテンツ抽出
ウェブサイトをナビゲートし、調査やモニタリングのために構造化データを抽出
ビジュアルブラウザテスト
ブラウザ操作を録画してビジュアルドキュメントを作成したり、問題をデバッグ
これらのプロンプトを試す
agent-browser スキルを使用して [URL] を開き、ページ上のすべてのインタラクティブ要素の要素参照を取得する。
セッション [SESSION_ID] を使用して、参照 @e1 のフォームフィールドにテキスト '[TEXT]' を入力し、参照 @e2 のボタンをクリックする。
現在のセッション [SESSION_ID] のページ全体のスクリーンショットを撮影して保存する。
要素 @e1 をクリックして次のページにナビゲートし、スナップショットを撮影して新しいページからすべての見出しテキストを抽出する。
ベストプラクティス
- ナビゲーション後は常に再スナップショットして新しい要素参照を取得
- 非同期読み込みをトリガーするアクションの後には明示的な待機を使用
- 完了したらセッションを閉じてブラウザリソースを解放
- デバッグが必要な場合のみビデオ録画を有効化
回避
- 再スナップショットせずに前のページの要素参照を使用
- クリックアクション後のナビゲーションを処理しない
- セッションIDのリークやセッションライフサイクルの管理不全
- 表示されていない可能性がある要素との対話を試みる