agent-browser
Automatiser la navigation web avec des agents IA
Également disponible depuis: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs
Les agents IA doivent interagir avec les sites web mais ne disposent pas de capacités de navigateur. Cette compétence fournit une automatisation de navigateur headless via inference.sh, permettant à Claude, Codex et Claude Code de naviguer sur les pages, remplir des formulaires, capturer des captures d'écran et enregistrer des sessions.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "agent-browser". Open https://example.com and identify the login form elements
Résultat attendu:
Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'
Utilisation de "agent-browser". Fill and submit the login form with test credentials
Résultat attendu:
Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.
Utilisation de "agent-browser". Take a screenshot of the dashboard
Résultat attendu:
Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons
Audit de sécurité
SûrAll static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.
Facteurs de risque
⚙️ Commandes externes (4)
🌐 Accès réseau (4)
📁 Accès au système de fichiers (2)
Score de qualité
Ce que vous pouvez construire
Recherche et extraction de données
Les agents IA parcourent les sites web pour rassembler des informations, extraire des données structurées des pages et compiler des rapports de recherche sans navigation manuelle.
Soumission de formulaire automatisée
Les agents IA remplissent et soumettent des formulaires web pour des tâches comme la réservation de rendez-vous, l'enregistrement de comptes ou la saisie de données par lots.
Test basé sur le navigateur
Les ingénieurs QA utilisent des agents IA pour naviguer sur les sites web, capturer des captures d'écran et enregistrer des sessions de test pour vérifier la fonctionnalité de l'interface utilisateur.
Essayez ces prompts
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.
Bonnes pratiques
- Toujours re-snapshot après la navigation ou les changements DOM; les refs d'éléments expirent après le chargement des pages
- Utiliser les variables d'environnement pour les identifiants; ne jamais coder en dur les mots de passe dans les scripts
- Fermer les sessions quand terminé; les enregistrements vidéo sont disponibles seulement jusqu'à l'appel de close
Éviter
- Ne pas mettre en cache les refs d'éléments à travers les pages différentes; toujours snapshot après la navigation
- Ne pas coder en dur les identifiants; utiliser les variables d'environnement comme $APP_USERNAME et $APP_PASSWORD
- Ne pas sauter les temps d'attente après les actions; laisser les pages charger complètement avant d'interagir