agent-browser
Browser-Automatisierung für KI-Agenten
Également disponible depuis: inference-sh-9,inferen-sh,inference-shell,inf-sh,inference-sh-8,inferencesh,skillssh,inference-sh-0,supercent-io,tul-sh,vercel-labs
Ermöglicht KI-Agenten die Automatisierung von Web-Browsing-Tasks einschließlich Formularausfüllung, Datenextraktion, Screenshot-Capture und Videoaufzeichnung über eine einfache Befehlszeilenschnittstelle.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "agent-browser". Öffnen Sie https://example.com und zeigen Sie Elemente
Résultat attendu:
Sitzung gestartet mit ID: abc123
Gefundene interaktive Elemente:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"
Utilisation de "agent-browser". Machen Sie einen Screenshot der aktuellen Seite
Résultat attendu:
Screenshot gespeichert unter: /tmp/screenshot_20240115_143022.png
Seitentitel: Example Domain
Viewport: 1280x720
Audit de sécurité
Risque faibleThis is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.
Problèmes à risque élevé (1)
Problèmes à risque moyen (1)
Problèmes à risque faible (2)
Facteurs de risque
⚙️ Commandes externes (1)
🌐 Accès réseau (1)
📁 Accès au système de fichiers (1)
Score de qualité
Ce que vous pouvez construire
Automatisiertes Web-Testing
KI-Agenten können zu Webanwendungen navigieren, Testformulare ausfüllen, UI-Elemente verifizieren und Testergebnisse als Screenshots oder Videos erfassen.
Datenextraktion und Recherche
Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Elemente identifizieren und Informationen programmgesteuert sammeln.
Formular-Automatisierungs-Workflows
Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Dateneingabe, Anwendungen übermitteln und Massenoperationen über mehrere Seiten.
Essayez ces prompts
Verwenden Sie den Browser-Automatisierungs-Skill, um https://example.com zu öffnen und mir alle interaktiven Elemente auf der Seite mit ihren Referenzen zu zeigen.
Navigieren Sie zur Anmeldeseite unter [URL], füllen Sie das E-Mail-Feld mit user@example.com aus, füllen Sie das Passwort-Feld mit mypassword, klicken Sie dann auf den Absenden-Button. Machen Sie nach dem Absenden einen Screenshot.
Öffnen Sie die Seite unter [URL], identifizieren Sie alle Tabellenzeilen in der Datentabelle und extrahieren Sie den Textinhalt aus jeder Zeile. Geben Sie die Daten als strukturierte Liste zurück.
Starten Sie eine neue Browsersitzung mit aktivierter Videoaufzeichnung. Navigieren Sie durch diese Schritte: [Schritte auflisten], schließen Sie dann die Sitzung und geben Sie den Videodateipfad an.
Bonnes pratiques
- Verwenden Sie Elementreferenzen (@e1, @e2) für zuverlässiges Element-Targeting statt CSS-Selektoren
- Machen Sie nach jeder Navigation oder bedeutenden Seitenänderung Snapshots, um frische Elementreferenzen zu erhalten
- Aktivieren Sie die Videoaufzeichnung zum Debuggen komplexer Automatisierungs-Workflows
- Verwenden Sie Proxy-Einstellungen beim Testen von geografisch eingeschränktem Inhalt oder wenn Anonymität erforderlich ist
Éviter
- Verlassen Sie sich nicht auf Elementpositionen oder Koordinaten - verwenden Sie stattdessen @e-Referenzen für stabiles Targeting
- Vermeiden Sie lange Wartezeiten; verwenden Sie explizite Wartezeiten für die Elementsichtbarkeit statt fester Verzögerungen
- Überspringen Sie nicht das erneute Snapshotting nach der Seitennavigation - Elementreferenzen veralten
- Vermeiden Sie das Hochladen sensibler Dateien ohne zu verifizieren, dass die Zielwebsite Uploads akzeptiert