🌐

agent-browser

Name: agent-browser
Author: infsh-skills

Mittleres Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Browseraufgaben mit KI-Agenten automatisieren

Auch verfügbar von: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,toolshell,tul-sh,supercent-io

KI-Agenten müssen mit Webseiten interagieren, haben aber keine Browserfähigkeiten. Diese Fähigkeit bietet Headless-Browser-Automatisierung durch einfache Shell-Befehle und ermöglicht Web-Scraping, Formularausfüllung und automatisierte Test-Workflows.

Unterstützt: Claude Codex Code(CC)

⚠️ 62 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Beispielseite öffnen und klickbare Elemente auflisten

Erwartetes Ergebnis:

Session gestartet: abc123
URL: https://example.com
Titel: Example Domain

Klickbare Elemente:
- @e1 [a] 'Weitere Informationen...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Loslegen'
- @e4 [input type='email'] placeholder='E-Mail eingeben'

Screenshot gespeichert unter: ./screenshots/example.com_20240101.png

Verwendung von "agent-browser". Anmeldeformular ausfüllen und Erfolg verifizieren

Erwartetes Ergebnis:

Anmelde-Workflow abgeschlossen:
1. Anmeldeseite geöffnet
2. E-Mail-Feld mit user@example.com ausgefüllt
3. Passwortfeld ausgefüllt
4. Anmelden-Button geklickt
5. Auf Weiterleitung gewartet
6. URL-Änderung von /login zu /dashboard verifiziert
7. Dashboard-Screenshot aufgenommen

Session-ID: abc123 (aktiv)
Screenshot: ./screenshots/dashboard_20240101.png

Sicherheitsaudit

Mittleres Risiko

v1 • 4/29/2026

Static analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.

Gescannte Dateien

2,313

Analysierte Zeilen

befunde

Gesamtzahl Audits

Probleme mit mittlerem Risiko (4)

references/authentication.md:20-283 references/commands.md:9-273 references/proxy-support.md:21-293 references/session-management.md:30-196 SKILL.md:9-273

Shell Command Usage in Documentation

501 shell command patterns detected in documentation files (authentication.md, commands.md, proxy-support.md, etc.). These are example commands showing how to use the belt CLI tool, not actual code execution vulnerabilities.

references/session-management.md:20-21 references/session-management.md:67-69

Browser Credential and Storage Access

Skill accesses browser session state including cookies, LocalStorage, and SessionStorage. This is expected behavior for browser automation tools and is documented for legitimate use cases.

SKILL.md:9-15 references/authentication.md:25-194 references/proxy-support.md:23-259

Network Access for Browser Service

Skill communicates with inference.sh service for browser control. URLs in documentation are legitimate service endpoints.

references/authentication.md:5 references/commands.md:3-59 references/proxy-support.md:5

Path Traversal Patterns in Documentation

Path traversal patterns (../) found in documentation are relative paths for file references, not actual path traversal vulnerabilities.

Risikofaktoren

⚙️ Externe Befehle (4)

SKILL.md:34-58 references/authentication.md:20-297 references/commands.md:9-273 templates/authenticated-session.sh:40-130

🌐 Netzwerkzugriff (3)

SKILL.md:9-15 references/authentication.md:25-194 templates/authenticated-session.sh:118

📁 Dateisystemzugriff (2)

SKILL.md:3 templates/authenticated-session.sh:30

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Web-Datenextraktion für Forschung

Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Suchformulare ausfüllen und Seiteninhalte sammeln. Nützlich für Marktforschung, Wettbewerbsanalyse und Datensammlungsaufgaben.

Automatisierte Formularübermittlungs-Workflows

Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Bewerbungen, Umfrageabschlüsse oder Dateneingabe. Verarbeiten Sie mehrstufige Formulare mit bedingter Navigation und Verifizierung.

Browser-basiertes API-Testing

Testen Sie Web-Anwendungen, die Browser-Kontext erfordern, wie SPAs mit clientseitiger Authentifizierung oder JavaScript-lastige Workflows. Erfassen Sie Screenshots und Videos zur Dokumentation.

Probiere diese Prompts

Website öffnen und erkunden

Verwenden Sie die agent-browser Fähigkeit, um https://example.com zu öffnen, einen Screenshot aufzunehmen und alle klickbaren Elemente auf der Seite aufzulisten.

Anmelden und Zugriff verifizieren

Verwenden Sie agent-browser, um sich bei https://app.example.com mit der E-Mail user@example.com und dem Passwort aus der Umgebungsvariable PASSWORD anzumelden. Überprüfen Sie nach der Anmeldung, ob Sie auf die Dashboard-Seite zugreifen können, und nehmen Sie einen Screenshot auf.

Mehrstufige Formularautomatisierung

Erstellen Sie ein Skript mit agent-browser, um ein mehrstufiges Registrierungsformular auszufüllen: Öffnen Sie das Formular, füllen Sie Schritt 1 mit Name und E-Mail aus, gehen Sie zu Schritt 2 weiter, füllen Sie Adressdetails aus, senden Sie ab und verifizieren Sie die Erfolgsmeldung.

Parallele Session-Datensammlung

Verwenden Sie agent-browser, um drei verschiedene Produktseiten in parallelen Sessions zu öffnen, Preise und Verfügbarkeit von jeder zu extrahieren und alle Sessions zu schließen. Vergleichen Sie die gesammelten Daten.

Bewährte Verfahren

Verwenden Sie immer Umgebungsvariablen für sensible Daten wie Passwörter, anstatt Anmeldedaten direkt in Skripten zu hardcodieren
Erstellen Sie nach jeder Navigation oder DOM-Änderungen einen neuen Snapshot der Seite, um frische Elementreferenzen zu erhalten, bevor Sie interagieren
Aktivieren Sie die Videoaufzeichnung nur während des Debuggings, um das Erfassen sensibler Informationen in der Produktion zu vermeiden

Vermeiden

Hardcoden Sie keine Passwörter oder API-Schlüssel direkt in Skripten oder Befehlsargumenten
Überspringen Sie den Snapshot-Schritt nach der Seiten-Navigation nicht – veraltete Elementreferenzen führen zu Fehlern
Lassen Sie Sessions nicht unnötig offen – schließen Sie Sessions immer, wenn Sie fertig sind, um Ressourcen freizugeben

Häufig gestellte Fragen

Was ist inference.sh und warum wird es benötigt?

Inference.sh ist der Cloud-Dienst, der den Headless-Browser ausführt. Sie benötigen ein Konto, um das belt CLI-Tool zu verwenden, von dem diese Fähigkeit abhängt.

Kann diese Fähigkeit CAPTCHAs umgehen?

Nein, diese Fähigkeit kann CAPTCHAs oder fortschrittliche Bot-Erkennungssysteme nicht umgehen. Sie funktioniert nur mit Standard-Webseiten.

Wie gehe ich mit Anmeldeseiten um, die Zwei-Faktor-Authentifizierung erfordern?

Verwenden Sie die Session-Persistenzfunktion, um den 2FA-Schritt manuell abzuschließen, und lassen Sie dann den KI-Agenten mit der authentifizierten Session fortfahren.

Warum funktionieren meine Elementreferenzen nicht?

Elementreferenzen werden nach Seiten-Navigation oder dynamischen Inhaltsänderungen veraltet. Rufen Sie immer die Snapshot-Funktion auf, um frische Referenzen zu erhalten.

Kann ich mehrere Browser-Sessions gleichzeitig ausführen?

Ja, Sie können mehrere parallele Sessions erstellen, indem Sie unterschiedliche Session-IDs verwenden. Jede Session verwaltet ihren eigenen Browser-Kontext.

Wie speichere ich Screenshots oder Videos?

Screenshots werden als base64-Daten oder Dateien zurückgegeben. Aktivieren Sie record_video während des Öffnens, um Video aufzunehmen, das beim Schließen der Session zurückgegeben wird.