🌐

agent-browser

Name: agent-browser
Author: toolshell

Niedriges Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Browser-Automatisierung für KI-Agenten

Auch verfügbar von: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,skillssh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,tul-sh,supercent-io

Ermöglicht KI-Agenten die Automatisierung von Web-Browsing-Tasks einschließlich Formularausfüllung, Datenextraktion, Screenshot-Capture und Videoaufzeichnung über eine einfache Befehlszeilenschnittstelle.

Unterstützt: Claude Codex Code(CC)

⚠️ 66 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Öffnen Sie https://example.com und zeigen Sie Elemente

Erwartetes Ergebnis:

Sitzung gestartet mit ID: abc123

Gefundene interaktive Elemente:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"

Verwendung von "agent-browser". Machen Sie einen Screenshot der aktuellen Seite

Erwartetes Ergebnis:

Screenshot gespeichert unter: /tmp/screenshot_20240115_143022.png

Seitentitel: Example Domain
Viewport: 1280x720

Sicherheitsaudit

Niedriges Risiko

v1 • 3/8/2026

This is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.

Gescannte Dateien

2,312

Analysierte Zeilen

befunde

Gesamtzahl Audits

Probleme mit hohem Risiko (1)

SKILL.md:1-10 templates/authenticated-session.sh:1-50

Heuristic Warning: Browser Automation Capabilities

The skill combines browser automation, network access, and credential handling. This is expected behavior for a browser automation tool and represents legitimate functionality.

Probleme mit mittlerem Risiko (1)

SKILL.md:34-60 references/commands.md:1-50

Shell Command Documentation

The skill documentation shows example shell commands using infsh CLI. These are documentation examples, not actual code execution vulnerabilities.

Probleme mit niedrigem Risiko (2)

SKILL.md:9-11

Network Access for Browser Automation

The skill requires network access to navigate websites. This is expected behavior for browser automation.

SKILL.md:67-69

Filesystem Access for Screenshots and Videos

The skill can save screenshots and recordings to filesystem. This is expected functionality for a browser automation tool.

Risikofaktoren

⚙️ Externe Befehle (1)

SKILL.md:34-60

🌐 Netzwerkzugriff (1)

SKILL.md:9-11

📁 Dateisystemzugriff (1)

SKILL.md:67-69

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Automatisiertes Web-Testing

KI-Agenten können zu Webanwendungen navigieren, Testformulare ausfüllen, UI-Elemente verifizieren und Testergebnisse als Screenshots oder Videos erfassen.

Datenextraktion und Recherche

Extrahieren Sie strukturierte Daten von Websites, indem Sie Seiten navigieren, Elemente identifizieren und Informationen programmgesteuert sammeln.

Formular-Automatisierungs-Workflows

Automatisieren Sie wiederkehrende Formularausfüllaufgaben wie Dateneingabe, Anwendungen übermitteln und Massenoperationen über mehrere Seiten.

Probiere diese Prompts

Website öffnen und Elemente abrufen

Verwenden Sie den Browser-Automatisierungs-Skill, um https://example.com zu öffnen und mir alle interaktiven Elemente auf der Seite mit ihren Referenzen zu zeigen.

Formular ausfüllen und absenden

Navigieren Sie zur Anmeldeseite unter [URL], füllen Sie das E-Mail-Feld mit user@example.com aus, füllen Sie das Passwort-Feld mit mypassword, klicken Sie dann auf den Absenden-Button. Machen Sie nach dem Absenden einen Screenshot.

Daten aus Tabelle extrahieren

Öffnen Sie die Seite unter [URL], identifizieren Sie alle Tabellenzeilen in der Datentabelle und extrahieren Sie den Textinhalt aus jeder Zeile. Geben Sie die Daten als strukturierte Liste zurück.

Workflow-Video aufzeichnen

Starten Sie eine neue Browsersitzung mit aktivierter Videoaufzeichnung. Navigieren Sie durch diese Schritte: [Schritte auflisten], schließen Sie dann die Sitzung und geben Sie den Videodateipfad an.

Bewährte Verfahren

Verwenden Sie Elementreferenzen (@e1, @e2) für zuverlässiges Element-Targeting statt CSS-Selektoren
Machen Sie nach jeder Navigation oder bedeutenden Seitenänderung Snapshots, um frische Elementreferenzen zu erhalten
Aktivieren Sie die Videoaufzeichnung zum Debuggen komplexer Automatisierungs-Workflows
Verwenden Sie Proxy-Einstellungen beim Testen von geografisch eingeschränktem Inhalt oder wenn Anonymität erforderlich ist

Vermeiden

Verlassen Sie sich nicht auf Elementpositionen oder Koordinaten - verwenden Sie stattdessen @e-Referenzen für stabiles Targeting
Vermeiden Sie lange Wartezeiten; verwenden Sie explizite Wartezeiten für die Elementsichtbarkeit statt fester Verzögerungen
Überspringen Sie nicht das erneute Snapshotting nach der Seitennavigation - Elementreferenzen veralten
Vermeiden Sie das Hochladen sensibler Dateien ohne zu verifizieren, dass die Zielwebsite Uploads akzeptiert

Häufig gestellte Fragen

Was ist inference.sh und benötige ich ein Konto?

Inference.sh ist der zugrundeliegende Service, der Browser-Automatisierungsfunktionen bereitstellt. Sie müssen die infsh CLI installieren und mit Ihren Kontozugangsdaten konfigurieren, um diesen Skill zu verwenden.

Kann dieser Skill Anmeldeformulare oder CAPTCHAs umgehen?

Nein, dieser Skill kann Authentifizierungssysteme oder CAPTCHAs nicht umgehen. Er kann nur programmgesteuert mit Webseiten interagieren, nachdem Sie Zugangsdaten bereitgestellt haben oder wenn die Authentifizierung bereits gehandhabt wird.

Wie funktionieren Elementreferenzen (@e1, @e2)?

Elementreferenzen werden von der Snapshot-Funktion zugewiesen. Jedes Mal, wenn Sie snapshot aufrufen, erhalten Sie eine frische Liste interaktiver Elemente mit ihren @e-Präfixen. Verwenden Sie diese Referenzen in nachfolgenden interact-Befehlen.

Kann ich mehrere Browsersitzungen gleichzeitig ausführen?

Ja, jede Sitzung hat eine eindeutige Sitzungs-ID. Sie können mehrere Sitzungen parallel verwalten, indem Sie verschiedene Sitzungsbezeichner verwenden.

Welche Browser werden unterstützt?

Der Skill verwendet unter der Haube Playwright und unterstützt Chromium, Firefox und WebKit. Der Standard ist Chromium für maximale Kompatibilität.

Wie gehe ich mit dynamischen Inhalten um, die langsam laden?

Verwenden Sie die 'wait'-Aktion mit Millisekunden oder die 'wait_for'-Option in der interact-Funktion. Sie können auch JavaScript ausführen, um auf bestimmte Bedingungen zu warten.