agent-browser
Browseraufgaben mit KI-Agenten automatisieren
Auch verfügbar von: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh
KI-Agenten müssen mit Webseiten interagieren, haben aber keine Browserfähigkeiten. Diese Fähigkeit bietet Headless-Browser-Automatisierung durch einfache Shell-Befehle und ermöglicht Web-Scraping, Formularausfüllung und automatisierte Test-Workflows.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "agent-browser". Beispielseite öffnen und klickbare Elemente auflisten
Erwartetes Ergebnis:
Session gestartet: abc123
URL: https://example.com
Titel: Example Domain
Klickbare Elemente:
- @e1 [a] 'Weitere Informationen...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Loslegen'
- @e4 [input type='email'] placeholder='E-Mail eingeben'
Screenshot gespeichert unter: ./screenshots/example.com_20240101.png
Verwendung von "agent-browser". Anmeldeformular ausfüllen und Erfolg verifizieren
Erwartetes Ergebnis:
Anmelde-Workflow abgeschlossen:
1. Anmeldeseite geöffnet
2. E-Mail-Feld mit user@example.com ausgefüllt
3. Passwortfeld ausgefüllt
4. Anmelden-Button geklickt
5. Auf Weiterleitung gewartet
6. URL-Änderung von /login zu /dashboard verifiziert
7. Dashboard-Screenshot aufgenommen
Session-ID: abc123 (aktiv)
Screenshot: ./screenshots/dashboard_20240101.png
Sicherheitsaudit
Mittleres RisikoStatic analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.
Probleme mit mittlerem Risiko (4)
Risikofaktoren
⚙️ Externe Befehle (4)
🌐 Netzwerkzugriff (3)
📁 Dateisystemzugriff (2)
Qualitätsbewertung
Was du bauen kannst
Web-Datenextraktion für Forschung
Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Suchformulare ausfüllen und Seiteninhalte sammeln. Nützlich für Marktforschung, Wettbewerbsanalyse und Datensammlungsaufgaben.
Automatisierte Formularübermittlungs-Workflows
Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Bewerbungen, Umfrageabschlüsse oder Dateneingabe. Verarbeiten Sie mehrstufige Formulare mit bedingter Navigation und Verifizierung.
Browser-basiertes API-Testing
Testen Sie Web-Anwendungen, die Browser-Kontext erfordern, wie SPAs mit clientseitiger Authentifizierung oder JavaScript-lastige Workflows. Erfassen Sie Screenshots und Videos zur Dokumentation.
Probiere diese Prompts
Verwenden Sie die agent-browser Fähigkeit, um https://example.com zu öffnen, einen Screenshot aufzunehmen und alle klickbaren Elemente auf der Seite aufzulisten.
Verwenden Sie agent-browser, um sich bei https://app.example.com mit der E-Mail user@example.com und dem Passwort aus der Umgebungsvariable PASSWORD anzumelden. Überprüfen Sie nach der Anmeldung, ob Sie auf die Dashboard-Seite zugreifen können, und nehmen Sie einen Screenshot auf.
Erstellen Sie ein Skript mit agent-browser, um ein mehrstufiges Registrierungsformular auszufüllen: Öffnen Sie das Formular, füllen Sie Schritt 1 mit Name und E-Mail aus, gehen Sie zu Schritt 2 weiter, füllen Sie Adressdetails aus, senden Sie ab und verifizieren Sie die Erfolgsmeldung.
Verwenden Sie agent-browser, um drei verschiedene Produktseiten in parallelen Sessions zu öffnen, Preise und Verfügbarkeit von jeder zu extrahieren und alle Sessions zu schließen. Vergleichen Sie die gesammelten Daten.
Bewährte Verfahren
- Verwenden Sie immer Umgebungsvariablen für sensible Daten wie Passwörter, anstatt Anmeldedaten direkt in Skripten zu hardcodieren
- Erstellen Sie nach jeder Navigation oder DOM-Änderungen einen neuen Snapshot der Seite, um frische Elementreferenzen zu erhalten, bevor Sie interagieren
- Aktivieren Sie die Videoaufzeichnung nur während des Debuggings, um das Erfassen sensibler Informationen in der Produktion zu vermeiden
Vermeiden
- Hardcoden Sie keine Passwörter oder API-Schlüssel direkt in Skripten oder Befehlsargumenten
- Überspringen Sie den Snapshot-Schritt nach der Seiten-Navigation nicht – veraltete Elementreferenzen führen zu Fehlern
- Lassen Sie Sessions nicht unnötig offen – schließen Sie Sessions immer, wenn Sie fertig sind, um Ressourcen freizugeben