スキル agent-browser

🌐

agent-browser

Name: agent-browser
Author: inference-sh-0

低リスク ⚙️ 外部コマンド🌐 ネットワークアクセス📁 ファイルシステムへのアクセス

AIエージェントでブラウザタスクを自動化

こちらからも入手できます: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

このスキルは、シンプルな@e参照システムを通じて、AIエージェントがナビゲーション、フォーム入力、データ抽出、ビジュ��ル録画などのブラウザ操作を自動化できるようにします。

対応: Claude Codex Code(CC)

⚠️ 68 貧弱

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「agent-browser」を使用しています。 https://example.com を開いて要素を取得

期待される結果:

セッションがID: abc123で開始されました。検出された要素: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

「agent-browser」を使用しています。ログインフォームに入力して送信

期待される結果:

@e1 に 'user@example.com' を入力、@e2 に 'password123' を入力、@e3 をクリック。ナビゲーションを検出。再スナップショットを推奨。

「agent-browser」を使用しています。スクリーンショットを撮影

期待される結果:

スクリーンショットをキャプチャ: {base64エンコードされた画像データ}, サイズ: 1920x1080

セキュリティ監査

低リスク

v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

スキャンされたファイル

2,310

解析された行数

検出結果

総監査数

低リスクの問題 (3)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215

Documentation Contains Shell Command Examples

The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.

SKILL.md:9-11 SKILL.md:20

Example URLs in Documentation

Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.

references/session-management.md:20-21 references/session-management.md:67-69

Browser Session Management

Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.

リスク要因

⚙️ 外部コマンド (5)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215 references/authentication.md:20-21 references/commands.md:9-11

🌐 ネットワークアクセス (2)

SKILL.md:9-11 SKILL.md:35

📁 ファイルシステムへのアクセス (1)

SKILL.md:162-163

監査者: claude

品質スコア

アーキテクチャ

100

保守性

コンテンツ

コミュニティ

セキュリティ

仕様準拠

作れるもの

自動フォーム送信

データ入力自動化のためにウェブフォームをプログラムで入力・送信

ウェブコンテンツ抽出

ウェブサイトをナビゲートし、調査やモニタリングのために構造化データを抽出

ビジュアルブラウザテスト

ブラウザ操作を録画してビジュアルドキュメントを作成したり、問題をデバッグ

これらのプロンプトを試す

開いてナビゲート

agent-browser スキルを使用して [URL] を開き、ページ上のすべてのインタラクティブ要素の要素参照を取得する。

フォームフィールドに入力

セッション [SESSION_ID] を使用して、参照 @e1 のフォームフィールドにテキスト '[TEXT]' を入力し、参照 @e2 のボタンをクリックする。

スクリーンショットをキャプチャ

現在のセッション [SESSION_ID] のページ全体のスクリーンショットを撮影して保存する。

アクション後にデータを抽出

要素 @e1 をクリックして次のページにナビゲートし、スナップショットを撮影して新しいページからすべての見出しテキストを抽出する。

ベストプラクティス

ナビゲーション後は常に再スナップショットして新しい要素参照を取得
非同期読み込みをトリガーするアクションの後には明示的な待機を使用
完了したらセッションを閉じてブラウザリソースを解放
デバッグが必要な場合のみビデオ録画を有効化

回避

再スナップショットせずに前のページの要素参照を使用
クリックアクション後のナビゲーションを処理しない
セッションIDのリークやセッションライフサイクルの管理不全
表示されていない可能性がある要素との対話を試みる

よくある質問

@e参照システムとは何ですか?

ページ上の要素は @e1, @e2 のような @e プレフィックス付きで返されます。これらの参照は、どの要素と対話するかを識別するために使用されます。参照は各スナップショット後に変更されます。

なぜナビゲーション後に再スナップショットが必要ですか?

新しいページにナビゲートすると、DOMが完全に変更されます。以前の要素参照は無効になり、新しい参照を取得する必要があります。

このスキルはログインページをバイパスできますか?

このスキルはログインフォームを自動化できますが、認証をバイパスすることはできません。後続の操作のためにログイン状態を維持するのを支援できます。

ビデオ録画は常に有効ですか?

いいえ、ビデオ録画は open 関数で record_video: true で明示的に有効にする必要があります。デフォルトではオフです。

どのようなプロキシオプションがありますか?

このスキルは、proxy_username と proxy_password によるオプションの認証付きで、HTTP、HTTPS、SOCKS5 プロキシをサポートしています。

カスタムJavaScriptを実行できますか?

はい、execute 関数を使用してブラウザコンテキストで JavaScript コードを実行できます。結果は文字列として返されます。

開発者の詳細

作成者

inference-sh-0

ライセンス

MIT

リポジトリ

https://github.com/inference-sh-0/skills/tree/main/skills/agentic-browser/

参照

main

ファイル構成

📁 references/

📄 authentication.md

📄 commands.md

📄 proxy-support.md

📄 session-management.md

📄 snapshot-refs.md

📄 video-recording.md

📁 templates/

📄 authenticated-session.sh

📄 capture-workflow.sh

📄 form-automation.sh

📄 SKILL.md