🌐

agent-browser

Name: agent-browser
Author: inference-sh-0

Niedriges Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Browser-Aufgaben mit KI-Agenten automatisieren

Auch verfügbar von: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

Dieser Skill ermöglicht KI-Agenten, Browser-Interaktionen zu automatisieren, einschließlich Navigation, Formularausfüllung, Datenextraktion und visueller Aufzeichnung durch ein einfaches @e-Referenzsystem.

Unterstützt: Claude Codex Code(CC)

⚠️ 68 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Open https://example.com and get elements

Erwartetes Ergebnis:

Session started with ID: abc123. Elements found: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."

Verwendung von "agent-browser". Fill login form and submit

Erwartetes Ergebnis:

Filled @e1 with 'user@example.com', filled @e2 with 'password123', clicked @e3. Navigation detected. Re-snapshot recommended.

Verwendung von "agent-browser". Take screenshot

Erwartetes Ergebnis:

Screenshot captured: {base64 encoded image data}, dimensions: 1920x1080

Sicherheitsaudit

Niedriges Risiko

v1 • 2/15/2026

This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.

Gescannte Dateien

2,310

Analysierte Zeilen

befunde

Gesamtzahl Audits

Probleme mit niedrigem Risiko (3)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215

Documentation Contains Shell Command Examples

The skill documentation includes bash scripts showing CLI usage. Command substitution syntax is for examples, not actual execution.

SKILL.md:9-11 SKILL.md:20

Example URLs in Documentation

Documentation contains test URLs like example.com and google.com - standard practice for technical documentation.

references/session-management.md:20-21 references/session-management.md:67-69

Browser Session Management

Skill manages browser sessions including cookies and authentication state. This is core browser automation functionality, not credential access vulnerability.

Risikofaktoren

⚙️ Externe Befehle (5)

SKILL.md:34-37 SKILL.md:114-118 SKILL.md:213-215 references/authentication.md:20-21 references/commands.md:9-11

🌐 Netzwerkzugriff (2)

SKILL.md:9-11 SKILL.md:35

📁 Dateisystemzugriff (1)

SKILL.md:162-163

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Automatisierte Formularübermittlung

Webformulare programmgesteuert ausfüllen und übermitteln zur Daten-Eingabeautomatisierung

Web-Content-Extraktion

Websites navigieren und strukturierte Daten für Forschung oder Überwachung extrahieren

Visuelle Browser-Tests

Browser-Interaktionen aufzeichnen, um visuelle Dokumentation zu erstellen oder Probleme zu debuggen

Probiere diese Prompts

Öffnen und Navigieren

Verwenden Sie den agent-browser-Skill, um [URL] zu öffnen und die Elementreferenzen für alle interaktiven Elemente auf der Seite zu erhalten.

Formularfelder ausfüllen

Verwenden Sie Session [SESSION_ID], füllen Sie das Formularfeld mit Ref @e1 mit dem Text '[TEXT]', dann klicken Sie auf den Button mit Ref @e2.

Screenshot erstellen

Erstellen Sie einen vollseitigen Screenshot der aktuellen Session [SESSION_ID] und speichern Sie ihn.

Daten nach Aktion extrahieren

Klicken Sie auf Element @e1 um zur nächsten Seite zu navigieren, dann erstellen Sie einen Snapshot und extrahieren Sie den gesamten Überschriftentext von der neuen Seite.

Bewährte Verfahren

Erstellen Sie nach der Navigation immer einen neuen Snapshot, um aktuelle Elementreferenzen zu erhalten
Verwenden Sie explizite Wartezeiten nach Aktionen, die asynchrones Laden auslösen
Schließen Sie Sitzungen nach Abschluss, um Browser-Ressourcen freizugeben
Aktivieren Sie Video-Aufzeichnung nur bei Bedarf für Debugging-Zwecke

Vermeiden

Verwendung von Element-Referenzen einer vorherigen Seite ohne erneuten Snapshot
Keine Behandlung von Navigation nach Klick-Aktionen
Leaken von Session-IDs oder keine Verwaltung des Session-Lebenszyklus
Versuch, mit Elementen zu interagieren, die möglicherweise nicht sichtbar sind

Häufig gestellte Fragen

Was ist das @e-Referenzsystem?

Elemente auf der Seite werden mit @e-Präfixen wie @e1, @e2 zurückgegeben. Diese Referenzen werden verwendet, um zu identifizieren, mit welchem Element interagiert werden soll. Die Referenzen ändern sich nach jedem Snapshot.

Warum muss ich nach der Navigation einen neuen Snapshot erstellen?

Wenn Sie zu einer neuen Seite navigieren, ändert sich das DOM vollständig. Vorherige Element-Referenzen werden ungültig und neue Referenzen müssen abgerufen werden.

Kann dieser Skill Login-Seiten umgehen?

Der Skill kann Login-Formulare automatisieren, kann aber keine Authentifizierung umgehen. Er kann helfen, eingeloggte Sitzungen für nachfolgende Operationen aufrechtzuerhalten.

Ist Video-Aufzeichnung immer aktiviert?

Nein, Video-Aufzeichnung muss explizit mit record_video: true in der open-Funktion aktiviert werden. Sie ist standardmäßig deaktiviert.

Welche Proxy-Optionen sind verfügbar?

Der Skill unterstützt HTTP-, HTTPS- und SOCKS5-Proxys mit optionaler Authentifizierung über proxy_username und proxy_password.

Kann ich benutzerdefiniertes JavaScript ausführen?

Ja, verwenden Sie die execute-Funktion, um JavaScript-Code im Browser-Kontext auszuführen. Das Ergebnis wird als String zurückgegeben.