スキル agent-browser
🌐

agent-browser

低リスク ⚙️ 外部コマンド🌐 ネットワークアクセス📁 ファイルシステムへのアクセス

AIエージェントでブラウザタスクを自動化

こちらからも入手できます: inference-sh-8,vercel-labs,inferencesh,inf-sh

このスキルは、シンプルな@e参照システムを通じて、AIエージェントがナビゲーション、フォーム入力、データ抽出、ビジュ��ル録画などのブラウザ操作を自動化できるようにします。

対応: Claude Codex Code(CC)
🥉 73 ブロンズ
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「agent-browser」を使用しています。 https://example.com を開いて要素を取得

期待される結果:

セッションがID: abc123で開始されました。検出された要素: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

「agent-browser」を使用しています。 ログインフォームに入力して送信

期待される結果:

@e1 に 'user@example.com' を入力、@e2 に 'password123' を入力、@e3 をクリック。ナビゲーションを検出。再スナップショットを推奨。

「agent-browser」を使用しています。 スクリーンショットを撮影

期待される結果:

スクリーンショットをキャプチャ: {base64エンコードされた画像データ}, サイズ: 1920x1080

セキュリティ監査

低リスク
v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

10
スキャンされたファイル
2,310
解析された行数
6
検出結果
1
総監査数
低リスクの問題 (3)
Documentation Contains Shell Command Examples
The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.
Example URLs in Documentation
Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.
Browser Session Management
Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.

リスク要因

⚙️ 外部コマンド (5)
🌐 ネットワークアクセス (2)
📁 ファイルシステムへのアクセス (1)
監査者: claude

品質スコア

45
アーキテクチャ
100
保守性
85
コンテンツ
50
コミュニティ
84
セキュリティ
91
仕様準拠

作れるもの

自動フォーム送信

データ入力自動化のためにウェブフォームをプログラムで入力・送信

ウェブコンテンツ抽出

ウェブサイトをナビゲートし、調査やモニタリングのために構造化データを抽出

ビジュアルブラウザテスト

ブラウザ操作を録画してビジュアルドキュメントを作成したり、問題をデバッグ

これらのプロンプトを試す

開いてナビゲート
agent-browser スキルを使用して [URL] を開き、ページ上のすべてのインタラクティブ要素の要素参照を取得する。
フォームフィールドに入力
セッション [SESSION_ID] を使用して、参照 @e1 のフォームフィールドにテキスト '[TEXT]' を入力し、参照 @e2 のボタンをクリックする。
スクリーンショットをキャプチャ
現在のセッション [SESSION_ID] のページ全体のスクリーンショットを撮影して保存する。
アクション後にデータを抽出
要素 @e1 をクリックして次のページにナビゲートし、スナップショットを撮影して新しいページからすべての見出しテキストを抽出する。

ベストプラクティス

  • ナビゲーション後は常に再スナップショットして新しい要素参照を取得
  • 非同期読み込みをトリガーするアクションの後には明示的な待機を使用
  • 完了したらセッションを閉じてブラウザリソースを解放
  • デバッグが必要な場合のみビデオ録画を有効化

回避

  • 再スナップショットせずに前のページの要素参照を使用
  • クリックアクション後のナビゲーションを処理しない
  • セッションIDのリークやセッションライフサイクルの管理不全
  • 表示されていない可能性がある要素との対話を試みる

よくある質問

@e参照システムとは何ですか?
ページ上の要素は @e1, @e2 のような @e プレフィックス付きで返されます。これらの参照は、どの要素と対話するかを識別するために使用されます。参照は各スナップショット後に変更されます。
なぜナビゲーション後に再スナップショットが必要ですか?
新しいページにナビゲートすると、DOMが完全に変更されます。以前の要素参照は無効になり、新しい参照を取得する必要があります。
このスキルはログインページをバイパスできますか?
このスキルはログインフォームを自動化できますが、認証をバイパスすることはできません。後続の操作のためにログイン状態を維持するのを支援できます。
ビデオ録画は常に有効ですか?
いいえ、ビデオ録画は open 関数で record_video: true で明示的に有効にする必要があります。デフォルトではオフです。
どのようなプロキシオプションがありますか?
このスキルは、proxy_username と proxy_password によるオプションの認証付きで、HTTP、HTTPS、SOCKS5 プロキシをサポートしています。
カスタムJavaScriptを実行できますか?
はい、execute 関数を使用してブラウザコンテキストで JavaScript コードを実行できます。結果は文字列として返されます。