Fähigkeiten agent-browser
🌐

agent-browser

Mittleres Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Browseraufgaben mit KI-Agenten automatisieren

Auch verfügbar von: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh

KI-Agenten müssen mit Webseiten interagieren, haben aber keine Browserfähigkeiten. Diese Fähigkeit bietet Headless-Browser-Automatisierung durch einfache Shell-Befehle und ermöglicht Web-Scraping, Formularausfüllung und automatisierte Test-Workflows.

Unterstützt: Claude Codex Code(CC)
⚠️ 66 Schlecht
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Beispielseite öffnen und klickbare Elemente auflisten

Erwartetes Ergebnis:

Session gestartet: abc123
URL: https://example.com
Titel: Example Domain

Klickbare Elemente:
- @e1 [a] 'Weitere Informationen...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Loslegen'
- @e4 [input type='email'] placeholder='E-Mail eingeben'

Screenshot gespeichert unter: ./screenshots/example.com_20240101.png

Verwendung von "agent-browser". Anmeldeformular ausfüllen und Erfolg verifizieren

Erwartetes Ergebnis:

Anmelde-Workflow abgeschlossen:
1. Anmeldeseite geöffnet
2. E-Mail-Feld mit user@example.com ausgefüllt
3. Passwortfeld ausgefüllt
4. Anmelden-Button geklickt
5. Auf Weiterleitung gewartet
6. URL-Änderung von /login zu /dashboard verifiziert
7. Dashboard-Screenshot aufgenommen

Session-ID: abc123 (aktiv)
Screenshot: ./screenshots/dashboard_20240101.png

Sicherheitsaudit

Mittleres Risiko
v1 • 4/29/2026

Static analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.

10
Gescannte Dateien
2,313
Analysierte Zeilen
7
befunde
1
Gesamtzahl Audits
Probleme mit mittlerem Risiko (4)
Shell Command Usage in Documentation
501 shell command patterns detected in documentation files (authentication.md, commands.md, proxy-support.md, etc.). These are example commands showing how to use the belt CLI tool, not actual code execution vulnerabilities.
Browser Credential and Storage Access
Skill accesses browser session state including cookies, LocalStorage, and SessionStorage. This is expected behavior for browser automation tools and is documented for legitimate use cases.
Network Access for Browser Service
Skill communicates with inference.sh service for browser control. URLs in documentation are legitimate service endpoints.
Path Traversal Patterns in Documentation
Path traversal patterns (../) found in documentation are relative paths for file references, not actual path traversal vulnerabilities.
Auditiert von: claude

Qualitätsbewertung

45
Architektur
100
Wartbarkeit
87
Inhalt
50
Community
45
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Web-Datenextraktion für Forschung

Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Suchformulare ausfüllen und Seiteninhalte sammeln. Nützlich für Marktforschung, Wettbewerbsanalyse und Datensammlungsaufgaben.

Automatisierte Formularübermittlungs-Workflows

Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Bewerbungen, Umfrageabschlüsse oder Dateneingabe. Verarbeiten Sie mehrstufige Formulare mit bedingter Navigation und Verifizierung.

Browser-basiertes API-Testing

Testen Sie Web-Anwendungen, die Browser-Kontext erfordern, wie SPAs mit clientseitiger Authentifizierung oder JavaScript-lastige Workflows. Erfassen Sie Screenshots und Videos zur Dokumentation.

Probiere diese Prompts

Website öffnen und erkunden
Verwenden Sie die agent-browser Fähigkeit, um https://example.com zu öffnen, einen Screenshot aufzunehmen und alle klickbaren Elemente auf der Seite aufzulisten.
Anmelden und Zugriff verifizieren
Verwenden Sie agent-browser, um sich bei https://app.example.com mit der E-Mail user@example.com und dem Passwort aus der Umgebungsvariable PASSWORD anzumelden. Überprüfen Sie nach der Anmeldung, ob Sie auf die Dashboard-Seite zugreifen können, und nehmen Sie einen Screenshot auf.
Mehrstufige Formularautomatisierung
Erstellen Sie ein Skript mit agent-browser, um ein mehrstufiges Registrierungsformular auszufüllen: Öffnen Sie das Formular, füllen Sie Schritt 1 mit Name und E-Mail aus, gehen Sie zu Schritt 2 weiter, füllen Sie Adressdetails aus, senden Sie ab und verifizieren Sie die Erfolgsmeldung.
Parallele Session-Datensammlung
Verwenden Sie agent-browser, um drei verschiedene Produktseiten in parallelen Sessions zu öffnen, Preise und Verfügbarkeit von jeder zu extrahieren und alle Sessions zu schließen. Vergleichen Sie die gesammelten Daten.

Bewährte Verfahren

  • Verwenden Sie immer Umgebungsvariablen für sensible Daten wie Passwörter, anstatt Anmeldedaten direkt in Skripten zu hardcodieren
  • Erstellen Sie nach jeder Navigation oder DOM-Änderungen einen neuen Snapshot der Seite, um frische Elementreferenzen zu erhalten, bevor Sie interagieren
  • Aktivieren Sie die Videoaufzeichnung nur während des Debuggings, um das Erfassen sensibler Informationen in der Produktion zu vermeiden

Vermeiden

  • Hardcoden Sie keine Passwörter oder API-Schlüssel direkt in Skripten oder Befehlsargumenten
  • Überspringen Sie den Snapshot-Schritt nach der Seiten-Navigation nicht – veraltete Elementreferenzen führen zu Fehlern
  • Lassen Sie Sessions nicht unnötig offen – schließen Sie Sessions immer, wenn Sie fertig sind, um Ressourcen freizugeben

Häufig gestellte Fragen

Was ist inference.sh und warum wird es benötigt?
Inference.sh ist der Cloud-Dienst, der den Headless-Browser ausführt. Sie benötigen ein Konto, um das belt CLI-Tool zu verwenden, von dem diese Fähigkeit abhängt.
Kann diese Fähigkeit CAPTCHAs umgehen?
Nein, diese Fähigkeit kann CAPTCHAs oder fortschrittliche Bot-Erkennungssysteme nicht umgehen. Sie funktioniert nur mit Standard-Webseiten.
Wie gehe ich mit Anmeldeseiten um, die Zwei-Faktor-Authentifizierung erfordern?
Verwenden Sie die Session-Persistenzfunktion, um den 2FA-Schritt manuell abzuschließen, und lassen Sie dann den KI-Agenten mit der authentifizierten Session fortfahren.
Warum funktionieren meine Elementreferenzen nicht?
Elementreferenzen werden nach Seiten-Navigation oder dynamischen Inhaltsänderungen veraltet. Rufen Sie immer die Snapshot-Funktion auf, um frische Referenzen zu erhalten.
Kann ich mehrere Browser-Sessions gleichzeitig ausführen?
Ja, Sie können mehrere parallele Sessions erstellen, indem Sie unterschiedliche Session-IDs verwenden. Jede Session verwaltet ihren eigenen Browser-Kontext.
Wie speichere ich Screenshots oder Videos?
Screenshots werden als base64-Daten oder Dateien zurückgegeben. Aktivieren Sie record_video während des Öffnens, um Video aufzunehmen, das beim Schließen der Session zurückgegeben wird.