Fähigkeiten agent-browser
🌐

agent-browser

Niedriges Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Browser-Aufgaben mit KI-Agenten automatisieren

Auch verfügbar von: inference-sh-8,vercel-labs,inferencesh,inf-sh

Dieser Skill ermöglicht KI-Agenten, Browser-Interaktionen zu automatisieren, einschließlich Navigation, Formularausfüllung, Datenextraktion und visueller Aufzeichnung durch ein einfaches @e-Referenzsystem.

Unterstützt: Claude Codex Code(CC)
🥉 73 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Open https://example.com and get elements

Erwartetes Ergebnis:

Session started with ID: abc123. Elements found: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

Verwendung von "agent-browser". Fill login form and submit

Erwartetes Ergebnis:

Filled @e1 with 'user@example.com', filled @e2 with 'password123', clicked @e3. Navigation detected. Re-snapshot recommended.

Verwendung von "agent-browser". Take screenshot

Erwartetes Ergebnis:

Screenshot captured: {base64 encoded image data}, dimensions: 1920x1080

Sicherheitsaudit

Niedriges Risiko
v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

10
Gescannte Dateien
2,310
Analysierte Zeilen
6
befunde
1
Gesamtzahl Audits
Probleme mit niedrigem Risiko (3)
Documentation Contains Shell Command Examples
The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.
Example URLs in Documentation
Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.
Browser Session Management
Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.
Auditiert von: claude

Qualitätsbewertung

45
Architektur
100
Wartbarkeit
85
Inhalt
50
Community
84
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Automatisierte Formularübermittlung

Webformulare programmgesteuert ausfüllen und übermitteln zur Daten-Eingabeautomatisierung

Web-Content-Extraktion

Websites navigieren und strukturierte Daten für Forschung oder Überwachung extrahieren

Visuelle Browser-Tests

Browser-Interaktionen aufzeichnen, um visuelle Dokumentation zu erstellen oder Probleme zu debuggen

Probiere diese Prompts

Öffnen und Navigieren
Verwenden Sie den agent-browser-Skill, um [URL] zu öffnen und die Elementreferenzen für alle interaktiven Elemente auf der Seite zu erhalten.
Formularfelder ausfüllen
Verwenden Sie Session [SESSION_ID], füllen Sie das Formularfeld mit Ref @e1 mit dem Text '[TEXT]', dann klicken Sie auf den Button mit Ref @e2.
Screenshot erstellen
Erstellen Sie einen vollseitigen Screenshot der aktuellen Session [SESSION_ID] und speichern Sie ihn.
Daten nach Aktion extrahieren
Klicken Sie auf Element @e1 um zur nächsten Seite zu navigieren, dann erstellen Sie einen Snapshot und extrahieren Sie den gesamten Überschriftentext von der neuen Seite.

Bewährte Verfahren

  • Erstellen Sie nach der Navigation immer einen neuen Snapshot, um aktuelle Elementreferenzen zu erhalten
  • Verwenden Sie explizite Wartezeiten nach Aktionen, die asynchrones Laden auslösen
  • Schließen Sie Sitzungen nach Abschluss, um Browser-Ressourcen freizugeben
  • Aktivieren Sie Video-Aufzeichnung nur bei Bedarf für Debugging-Zwecke

Vermeiden

  • Verwendung von Element-Referenzen einer vorherigen Seite ohne erneuten Snapshot
  • Keine Behandlung von Navigation nach Klick-Aktionen
  • Leaken von Session-IDs oder keine Verwaltung des Session-Lebenszyklus
  • Versuch, mit Elementen zu interagieren, die möglicherweise nicht sichtbar sind

Häufig gestellte Fragen

Was ist das @e-Referenzsystem?
Elemente auf der Seite werden mit @e-Präfixen wie @e1, @e2 zurückgegeben. Diese Referenzen werden verwendet, um zu identifizieren, mit welchem Element interagiert werden soll. Die Referenzen ändern sich nach jedem Snapshot.
Warum muss ich nach der Navigation einen neuen Snapshot erstellen?
Wenn Sie zu einer neuen Seite navigieren, ändert sich das DOM vollständig. Vorherige Element-Referenzen werden ungültig und neue Referenzen müssen abgerufen werden.
Kann dieser Skill Login-Seiten umgehen?
Der Skill kann Login-Formulare automatisieren, kann aber keine Authentifizierung umgehen. Er kann helfen, eingeloggte Sitzungen für nachfolgende Operationen aufrechtzuerhalten.
Ist Video-Aufzeichnung immer aktiviert?
Nein, Video-Aufzeichnung muss explizit mit record_video: true in der open-Funktion aktiviert werden. Sie ist standardmäßig deaktiviert.
Welche Proxy-Optionen sind verfügbar?
Der Skill unterstützt HTTP-, HTTPS- und SOCKS5-Proxys mit optionaler Authentifizierung über proxy_username und proxy_password.
Kann ich benutzerdefiniertes JavaScript ausführen?
Ja, verwenden Sie die execute-Funktion, um JavaScript-Code im Browser-Kontext auszuführen. Das Ergebnis wird als String zurückgegeben.