Compétences agent-browser
🌐

agent-browser

Risque faible ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

Automatisation du navigateur pour les agents IA

Également disponible depuis: inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,skillssh,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

Permettre aux agents IA d'automatiser les tâches de navigation web, notamment le remplissage de formulaires, l'extraction de données, la capture d'écrans et l'enregistrement vidéo, par le biais d'une interface en ligne de commande simple.

Prend en charge: Claude Codex Code(CC)
⚠️ 67 Médiocre
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "agent-browser". Open https://example.com and show elements

Résultat attendu:

Session started with ID: abc123

Interactive elements found:
- @e1 [a] "Example Domain" href="/"
- @e2 [h1] "Example Domain"
- @e3 [p] "This domain is for use in illustrative examples..."
- @e4 [a] "More information..." href="https://www.iana.org/domains/example"

Utilisation de "agent-browser". Take a screenshot of the current page

Résultat attendu:

Screenshot saved to: /tmp/screenshot_20240115_143022.png

Page title: Example Domain
Viewport: 1280x720

Audit de sécurité

Risque faible
v1 • 3/8/2026

This is a legitimate browser automation skill that uses inference.sh with Playwright. The static findings (external_commands, network, filesystem) are expected behavior for browser automation and represent documentation examples showing CLI usage, not actual security vulnerabilities. No malicious intent detected.

10
Fichiers analysés
2,312
Lignes analysées
7
résultats
1
Total des audits

Problèmes à risque élevé (1)

Heuristic Warning: Browser Automation Capabilities
The skill combines browser automation, network access, and credential handling. This is expected behavior for a browser automation tool and represents legitimate functionality.
Problèmes à risque moyen (1)
Shell Command Documentation
The skill documentation shows example shell commands using infsh CLI. These are documentation examples, not actual code execution vulnerabilities.
Problèmes à risque faible (2)
Network Access for Browser Automation
The skill requires network access to navigate websites. This is expected behavior for browser automation.
Filesystem Access for Screenshots and Videos
The skill can save screenshots and recordings to filesystem. This is expected functionality for a browser automation tool.

Facteurs de risque

⚙️ Commandes externes (1)
🌐 Accès réseau (1)
📁 Accès au système de fichiers (1)
Audité par: claude

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
25
Communauté
71
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Tests web automatisés

Les agents IA peuvent naviguer vers des applications web, remplir des formulaires de test, vérifier les éléments UI et capturer les résultats des tests en images ou en vidéo.

Extraction de données et recherche

Extraire des données structurées des sites web en naviguant sur les pages, en identifiant les éléments et en collectant les informations de manière programmée.

Automatisation des flux de travail de formulaires

Automatiser les tâches répétitives de remplissage de formulaires comme la saisie de données, les soumissions de candidatures et les opérations en masse sur plusieurs pages.

Essayez ces prompts

Ouvrir un site web et obtenir les éléments
Utiliser la compétence d'automatisation du navigateur pour ouvrir https://example.com et m'afficher tous les éléments interactifs de la page avec leurs références.
Remplir un formulaire et le soumettre
Naviguer vers la page de connexion à [URL], remplir le champ email avec user@example.com, remplir le champ mot de passe avec mypassword, puis cliquer sur le bouton de soumission. Prendre une capture d'écran après la soumission.
Extraire les données d'un tableau
Ouvrir la page à [URL], identifier toutes les lignes du tableau dans le tableau de données, et extraire le contenu textuel de chaque ligne. Retourner les données sous forme de liste structurée.
Enregistrer une vidéo du flux de travail
Démarrer une nouvelle session de navigateur avec l'enregistrement vidéo activé. Naviguer à travers ces étapes : [list steps], puis fermer la session et fournir le chemin du fichier vidéo.

Bonnes pratiques

  • Utilisez les références d'éléments (@e1, @e2) pour un ciblage fiable des éléments au lieu des sélecteurs CSS
  • Prenez des instantanés après chaque navigation ou changement significatif de page pour obtenir des références d'éléments fresh
  • Activez l'enregistrement vidéo pour déboguer les flux de travail d'automatisation complexes
  • Utilisez les paramètres de proxy lors du test de contenu géo-restreint ou pour l'anonymat

Éviter

  • Ne vous reposez pas sur les positions ou coordonnées des éléments - utilisez les références @e à la place pour un ciblage stable
  • Évitez les longs temps d'attente ; utilisez des attentes explicites pour la visibilité des éléments plutôt que des délais fixes
  • Ne sautez pas l'instantané après la navigation - les références d'éléments deviennent obsolètes
  • Évitez de télécharger des fichiers sensibles sans vérifier que le site cible accepte les téléversements

Foire aux questions

Qu'est-ce que inference.sh et ai-je besoin d'un compte ?
Inference.sh est le service sous-jacent qui fournit les capacités d'automatisation du navigateur. Vous devez installer l'interface CLI infsh et la configurer avec vos identifiants de compte pour utiliser cette compétence.
Cette compétence peut-elle contourner les formulaires de connexion ou les CAPTCHAs ?
Non, cette compétence ne peut pas contourner les systèmes d'authentification ou les CAPTCHAs. Elle peut uniquement interagir avec les pages web de manière programmée après que vous avez fourni des identifiants ou lorsque l'authentification est déjà gérée.
Comment fonctionnent les références d'éléments (@e1, @e2) ?
Les références d'éléments sont attribuées par la fonction d'instantané. Chaque fois que vous appelez instantané, vous obtenez une nouvelle liste d'éléments interactifs avec leurs préfixes @e. Utilisez ces références dans les commandes d'interaction suivantes.
Puis-je exécuter plusieurs sessions de navigateur simultanément ?
Oui, chaque session a un identifiant unique. Vous pouvez gérer plusieurs sessions en parallèle en utilisant différents identifiants de session.
Quels navigateurs sont pris en charge ?
La compétence utilise Playwright en interne, prenant en charge Chromium, Firefox et WebKit. Le défaut est Chromium pour une compatibilité maximale.
Comment gérer le contenu dynamique qui se charge lentement ?
Utilisez l'action 'wait' avec des millisecondes, ou utilisez l'option 'wait_for' dans la fonction d'interaction. Vous pouvez également exécuter du JavaScript pour attendre des conditions spécifiques.