agent-browser
AIエージェントでブラウザタスクを自動化
こちらからも入手できます: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh
AIエージェントはWebページと対話する必要がありますが、ブラウザ機能を持っていません。このスキルはシンプルなシェルコマンドでヘッドレスブラウザ自動化を提供し、Webスクレイピング、フォーム入力、自動テストワークフローを可能にします。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「agent-browser」を使用しています。 example.comを開いてクリック可能な要素をリスト
期待される結果:
セッション開始: abc123
URL: https://example.com
タイトル: Example Domain
クリック可能な要素:
- @e1 [a] '詳細情報...' href='https://example.com/about'
- @e2 [a] 'ドメイン' href='https://example.com/domains'
- @e3 [button] '始める'
- @e4 [input type='email'] placeholder='メールアドレスを入力'
スクリーンショット保存先: ./screenshots/example.com_20240101.png
「agent-browser」を使用しています。 ログインフォームに記入して成功を確認
期待される結果:
ログインワークフロー完了:
1. ログインページを開く
2. メールフィールドにuser@example.comを入力
3. パスワードフィールドを記入
4. サインインボタンをクリック
5. リダイレクトを待つ
6. URLが/loginから/dashboardに変わったことを確認
7. ダッシュボードのスクリーンショットをキャプチャ
セッションID: abc123 (アクティブ)
スクリーンショット: ./screenshots/dashboard_20240101.png
セキュリティ監査
中リスクStatic analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.
中リスクの問題 (4)
リスク要因
⚙️ 外部コマンド (4)
🌐 ネットワークアクセス (3)
📁 ファイルシステムへのアクセス (2)
品質スコア
作れるもの
研究のためのWebデータ抽出
ページのナビゲート、検索フォームの入力、ページコンテンツの収集を通じて、Webサイトか構造化データを抽出。市場調査、競合分析、データ収集タスクに有用。
自動化されたフォーム送信ワークフロー
求人応募、調査完了、データ入力などの反復的なフォーム入力タスクを自動化。条件付きナビゲーションと検証を伴うマルチステップフォームを処理。
ブラウザベースのAPIテスト
SPAのクライアントサイド認証やJavaScript集中的なワークフローなど、ブラウザコンテキストを必要とするWebアプリケーションをテスト。スクリーンショットとビデオをキャプチャしてドキュメント化。
これらのプロンプトを試す
agent-browserスキルを使用してhttps://example.comを開き、スクリーンショットを撮り、ページ上のクリック可能な要素をすべてリストアップしてください。
agent-browserを使用して、PASSWORD環境変数からemail user@example.comとパスワードでhttps://app.example.comにログイン。ログイン後、ダッシュボードページにアクセスできることを確認し、スクリーンショットを撮ってください。
agent-browserを使用してマルチステップ登録フォームを記入するスクリプトを作成:フォームを開き、ステップ1で名前とメールを入力し、ステップ2に進み、住所の詳細を入力し、送信し、成功メッセージを確認。
agent-browserを使用して3つの異なる商品ページを並列セッションで開き、それぞれから価格と在庫情報を抽出し、すべてのセッションを閉じる。収集したデータを比較。
ベストプラクティス
- スクリプトに認証情報をハードコードする代わりに、機密データ(パスワードなど)には常に環境変数を使用してください
- ナビゲートやDOM変更後は必ずページのスナップショットを更新して、対話前に新しい要素参照を取得してください
- 本番環境で機密情報をキャプチャするのを避けるため、ビデオ録画はデバッグ中にのみ有効にしてください
回避
- スクリプトやコマンド引数にパスワードやAPIキーを直接ハードコードしないでください
- ページナビゲート後にスナップショットの手順をスキップしないでください - 古い要素参照は失敗の原因になります
- セッションを不必要に開いたままにしないでください - 完了したら常にセッションを閉じてリソースを解放してください