🌐

agent-browser

Name: agent-browser
Author: skillssh

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Web-Browsing mit KI-Agenten automatisieren

Auch verfügbar von: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

KI-Agenten müssen mit Websites interagieren, verfügen aber nicht über Browser-Funktionen. Diese Fähigkeit bietet Headless-Browser-Automatisierung über inference.sh und ermöglicht Claude, Codex und Claude Code, Seiten zu navigieren, Formulare auszufüllen, Screenshots zu erstellen und Sitzungen aufzuzeichnen.

Unterstützt: Claude Codex Code(CC)

🥉 72 Bronze

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "agent-browser". Open https://example.com and identify the login form elements

Erwartetes Ergebnis:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

Verwendung von "agent-browser". Fill and submit the login form with test credentials

Erwartetes Ergebnis:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

Verwendung von "agent-browser". Take a screenshot of the dashboard

Erwartetes Ergebnis:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

Sicherheitsaudit

Sicher

v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

Gescannte Dateien

2,313

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (4)

SKILL.md:21-22 references/authentication.md:24-26 references/commands.md:10-11 templates/authenticated-session.sh:40-43

🌐 Netzwerkzugriff (4)

SKILL.md:9 SKILL.md:37 references/authentication.md:25 references/commands.md:25

📁 Dateisystemzugriff (2)

SKILL.md:195-200 references/authentication.md:5

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Recherche und Datenextraktion

KI-Agenten durchsuchen Websites, um Informationen zu sammeln, strukturierte Daten aus Seiten zu extrahieren und Recherchberichte ohne manuelles Surfen zu erstellen.

Automatisierte Formularübermittlung

KI-Agenten füllen Webformulare aus und übermitteln sie für Aufgaben wie Terminbuchungen, Kontoregistrierungen oder Stapeldateneingabe.

Browser-basierte Tests

QA-Ingenieure nutzen KI-Agenten, um Websites zu durchsuchen, Screenshots zu erstellen und Test-Sitzungen aufzuzeichnen, um die UI-Funktionalität zu überprüfen.

Probiere diese Prompts

Grundlegende Seitennavigation

Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.

Formularausfüllen-Workflow

Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.

Authentifizierte Sitzung mit Datenextraktion

Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.

Mehrseitige Recherche-Sitzung

Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

Bewährte Verfahren

Immer nach Navigation oder DOM-Änderungen neu snapshotten; Element-Referenzen verfallen nach Seitenladen
Umgebungsvariablen für Anmeldedaten verwenden; Passwörter niemals direkt in Skripten hardcodieren
Sitzungen bei Beendigung schließen; Videoaufzeichnungen sind nur bis zum Aufruf von close verfügbar

Vermeiden

Element-Referenzen nicht über verschiedene Seiten hinweg zwischenspeichern; immer nach Navigation snapshotten
Anmeldedaten nicht hardcodieren; Umgebungsvariablen wie $APP_USERNAME und $APP_PASSWORD verwenden
Wartezeiten nach Aktionen nicht überspringen; Seiten vollständig laden lassen, bevor interagiert wird

Häufig gestellte Fragen

Was ist inference.sh und muss ich es installieren?

Ja, inference.sh ist erforderlich. Es stellt die CLI (infsh) bereit, die die Browser-Automatisierung ausführt. Installieren Sie es von raw.githubusercontent.com/inference-sh/skills/main/cli-install.md

Warum funktionieren Element-Referenzen wie @e1 nicht mehr?

Element-Referenzen werden nach Seitenwechsel, DOM-Änderungen oder dynamischem Inhaltslading ungültig. Rufen Sie nach diesen Ereignissen immer die Snapshot-Funktion auf, um frische Referenzen zu erhalten.

Wie handhabe ich die Anmeldung für geschützte Websites?

Verwenden Sie den agent-browser Skill, um den Anmeldevorgang einmal zu automatisieren, und verwenden Sie dann die Sitzungs-ID für nachfolgende authentifizierte Anfragen wieder. Die Referenz authentication.md erklärt dieses Muster.

Kann ich Browser-Sitzungen als Video aufzeichnen?

Ja, aktivieren Sie record_video: true in der open-Funktion. Rufen Sie close auf, um die Videodatei abzurufen. Der Cursor kann mit show_cursor: true für klarere Demos angezeigt werden.

Wie lade ich Dateien über den Browser hoch?

Verwenden Sie die upload-Aktion mit dem file_paths-Array. Die Referenz muss auf ein Dateieingabe-Element zeigen. Beispiel: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}

Was passiert, wenn die Browser-Sitzung Zeitüberschreitung hat?

Sitzungen bleiben nach Server-Neustarts nicht bestehen. Behandeln Sie Fehler immer graceful und starten Sie den Workflow bei Bedarf neu. Videoaufzeichnungen gehen verloren, wenn close nicht vor dem Timeout aufgerufen wird.