Compétences agent-browser
🌐

agent-browser

Sûr ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

Automatiser la navigation web avec des agents IA

Également disponible depuis: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

Les agents IA doivent interagir avec les sites web mais ne disposent pas de capacités de navigateur. Cette compétence fournit une automatisation de navigateur headless via inference.sh, permettant à Claude, Codex et Claude Code de naviguer sur les pages, remplir des formulaires, capturer des captures d'écran et enregistrer des sessions.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "agent-browser". Open https://example.com and identify the login form elements

Résultat attendu:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

Utilisation de "agent-browser". Fill and submit the login form with test credentials

Résultat attendu:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

Utilisation de "agent-browser". Take a screenshot of the dashboard

Résultat attendu:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

Audit de sécurité

Sûr
v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

10
Fichiers analysés
2,313
Lignes analysées
3
résultats
1
Total des audits
Audité par: claude

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Recherche et extraction de données

Les agents IA parcourent les sites web pour rassembler des informations, extraire des données structurées des pages et compiler des rapports de recherche sans navigation manuelle.

Soumission de formulaire automatisée

Les agents IA remplissent et soumettent des formulaires web pour des tâches comme la réservation de rendez-vous, l'enregistrement de comptes ou la saisie de données par lots.

Test basé sur le navigateur

Les ingénieurs QA utilisent des agents IA pour naviguer sur les sites web, capturer des captures d'écran et enregistrer des sessions de test pour vérifier la fonctionnalité de l'interface utilisateur.

Essayez ces prompts

Navigation de page basique
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Flux de travail de remplissage de formulaire
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Session authentifiée avec extraction de données
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Session de recherche multi-pages
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

Bonnes pratiques

  • Toujours re-snapshot après la navigation ou les changements DOM; les refs d'éléments expirent après le chargement des pages
  • Utiliser les variables d'environnement pour les identifiants; ne jamais coder en dur les mots de passe dans les scripts
  • Fermer les sessions quand terminé; les enregistrements vidéo sont disponibles seulement jusqu'à l'appel de close

Éviter

  • Ne pas mettre en cache les refs d'éléments à travers les pages différentes; toujours snapshot après la navigation
  • Ne pas coder en dur les identifiants; utiliser les variables d'environnement comme $APP_USERNAME et $APP_PASSWORD
  • Ne pas sauter les temps d'attente après les actions; laisser les pages charger complètement avant d'interagir

Foire aux questions

Qu'est-ce que inference.sh et dois-je l'installer?
Oui, inference.sh est requis. Il fournit le CLI (infsh) qui exécute l'automatisation du navigateur. Installez-le depuis raw.githubusercontent.com/inference-sh/skills/main/cli-install.md
Pourquoi les refs d'éléments comme @e1 arrêtent de fonctionner?
Les refs d'éléments sont invalidées après la navigation de page, les changements DOM ou le chargement de contenu dynamique. Toujours appeler la fonction snapshot après ces événements pour obtenir de nouvelles refs.
Comment gérer la connexion pour les sites protégés?
Utiliser la compétence agent-browser pour automatiser le flux de connexion une fois, puis réutiliser l'ID de session pour les requêtes authentifiées ultérieures. La référence authentication.md explique ce pattern.
Puis-je enregistrer les sessions de navigateur en vidéo?
Oui, activer record_video: true dans la fonction open. Appeler close pour récupérer le fichier vidéo. Le curseur peut être affiché avec show_cursor: true pour des démos plus claires.
Comment télécharger des fichiers via le navigateur?
Utiliser l'action upload avec le tableau file_paths. La ref doit pointer vers un élément d'entrée de fichier. Exemple: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}
Que se passe-t-il si la session du navigateur expire?
Les sessions ne persistent pas à travers les redémarrages du serveur. Toujours gérer les erreurs avec élégance et redémarrer le flux de travail si nécessaire. Les enregistrements vidéo sont perdus si close n'est pas appelé avant le timeout.