Compétences agent-browser
🌐

agent-browser

Risque faible ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

Browser-Automatisierung für KI-Agenten

Également disponible depuis: inference-sh-9,inferen-sh,inference-shell,inf-sh,inference-sh-8,inferencesh,skillssh,inference-sh-0,supercent-io,tul-sh,vercel-labs

Ermöglicht KI-Agenten die Automatisierung von Web-Browsing-Tasks einschließlich Formularausfüllung, Datenextraktion, Screenshot-Capture und Videoaufzeichnung über eine einfache Befehlszeilenschnittstelle.

Prend en charge: Claude Codex Code(CC)
⚠️ 67 Médiocre
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "agent-browser". Öffnen Sie https://example.com und zeigen Sie Elemente

Résultat attendu:

Sitzung gestartet mit ID: abc123

Gefundene interaktive Elemente:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"

Utilisation de "agent-browser". Machen Sie einen Screenshot der aktuellen Seite

Résultat attendu:

Screenshot gespeichert unter: /tmp/screenshot_20240115_143022.png

Seitentitel: Example Domain
Viewport: 1280x720

Audit de sécurité

Risque faible
v1 • 3/8/2026

This is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.

10
Fichiers analysés
2,312
Lignes analysées
7
résultats
1
Total des audits

Problèmes à risque élevé (1)

Heuristic Warning: Browser Automation Capabilities
The skill combines browser automation, network access, and credential handling. This is expected behavior for a browser automation tool and represents legitimate functionality.
Problèmes à risque moyen (1)
Shell Command Documentation
The skill documentation shows example shell commands using infsh CLI. These are documentation examples, not actual code execution vulnerabilities.
Problèmes à risque faible (2)
Network Access for Browser Automation
The skill requires network access to navigate websites. This is expected behavior for browser automation.
Filesystem Access for Screenshots and Videos
The skill can save screenshots and recordings to filesystem. This is expected functionality for a browser automation tool.

Facteurs de risque

⚙️ Commandes externes (1)
🌐 Accès réseau (1)
📁 Accès au système de fichiers (1)
Audité par: claude

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
25
Communauté
71
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Automatisiertes Web-Testing

KI-Agenten können zu Webanwendungen navigieren, Testformulare ausfüllen, UI-Elemente verifizieren und Testergebnisse als Screenshots oder Videos erfassen.

Datenextraktion und Recherche

Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Elemente identifizieren und Informationen programmgesteuert sammeln.

Formular-Automatisierungs-Workflows

Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Dateneingabe, Anwendungen übermitteln und Massenoperationen über mehrere Seiten.

Essayez ces prompts

Website öffnen und Elemente abrufen
Verwenden Sie den Browser-Automatisierungs-Skill, um https://example.com zu öffnen und mir alle interaktiven Elemente auf der Seite mit ihren Referenzen zu zeigen.
Formular ausfüllen und absenden
Navigieren Sie zur Anmeldeseite unter [URL], füllen Sie das E-Mail-Feld mit user@example.com aus, füllen Sie das Passwort-Feld mit mypassword, klicken Sie dann auf den Absenden-Button. Machen Sie nach dem Absenden einen Screenshot.
Daten aus Tabelle extrahieren
Öffnen Sie die Seite unter [URL], identifizieren Sie alle Tabellenzeilen in der Datentabelle und extrahieren Sie den Textinhalt aus jeder Zeile. Geben Sie die Daten als strukturierte Liste zurück.
Workflow-Video aufzeichnen
Starten Sie eine neue Browsersitzung mit aktivierter Videoaufzeichnung. Navigieren Sie durch diese Schritte: [Schritte auflisten], schließen Sie dann die Sitzung und geben Sie den Videodateipfad an.

Bonnes pratiques

  • Verwenden Sie Elementreferenzen (@e1, @e2) für zuverlässiges Element-Targeting statt CSS-Selektoren
  • Machen Sie nach jeder Navigation oder bedeutenden Seitenänderung Snapshots, um frische Elementreferenzen zu erhalten
  • Aktivieren Sie die Videoaufzeichnung zum Debuggen komplexer Automatisierungs-Workflows
  • Verwenden Sie Proxy-Einstellungen beim Testen von geografisch eingeschränktem Inhalt oder wenn Anonymität erforderlich ist

Éviter

  • Verlassen Sie sich nicht auf Elementpositionen oder Koordinaten - verwenden Sie stattdessen @e-Referenzen für stabiles Targeting
  • Vermeiden Sie lange Wartezeiten; verwenden Sie explizite Wartezeiten für die Elementsichtbarkeit statt fester Verzögerungen
  • Überspringen Sie nicht das erneute Snapshotting nach der Seitennavigation - Elementreferenzen veralten
  • Vermeiden Sie das Hochladen sensibler Dateien ohne zu verifizieren, dass die Zielwebsite Uploads akzeptiert

Foire aux questions

Was ist inference.sh und benötige ich ein Konto?
Inference.sh ist der zugrundeliegende Service, der Browser-Automatisierungsfunktionen bereitstellt. Sie müssen die infsh CLI installieren und mit Ihren Kontozugangsdaten konfigurieren, um diesen Skill zu verwenden.
Kann dieser Skill Anmeldeformulare oder CAPTCHAs umgehen?
Nein, dieser Skill kann Authentifizierungssysteme oder CAPTCHAs nicht umgehen. Er kann nur programmgesteuert mit Webseiten interagieren, nachdem Sie Zugangsdaten bereitgestellt haben oder wenn die Authentifizierung bereits gehandhabt wird.
Wie funktionieren Elementreferenzen (@e1, @e2)?
Elementreferenzen werden von der Snapshot-Funktion zugewiesen. Jedes Mal, wenn Sie snapshot aufrufen, erhalten Sie eine frische Liste interaktiver Elemente mit ihren @e-Präfixen. Verwenden Sie diese Referenzen in nachfolgenden interact-Befehlen.
Kann ich mehrere Browsersitzungen gleichzeitig ausführen?
Ja, jede Sitzung hat eine eindeutige Sitzungs-ID. Sie können mehrere Sitzungen parallel verwalten, indem Sie verschiedene Sitzungsbezeichner verwenden.
Welche Browser werden unterstützt?
Der Skill verwendet unter der Haube Playwright und unterstützt Chromium, Firefox und WebKit. Der Standard ist Chromium für maximale Kompatibilität.
Wie gehe ich mit dynamischen Inhalten um, die langsam laden?
Verwenden Sie die 'wait'-Aktion mit Millisekunden oder die 'wait_for'-Option in der interact-Funktion. Sie können auch JavaScript ausführen, um auf bestimmte Bedingungen zu warten.