Compétences agent-browser
🌐

agent-browser

Sûr ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

Automatisez la navigation web avec des agents IA

Également disponible depuis: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,skillssh,supercent-io,inference-shell,inf-sh,vercel-labs

Automatisez les interactions web telles que le remplissage de formulaires, l'extraction de données et les tests sans contrôle manuel du navigateur. Cette compétence fournit aux agents IA des capacités d'automatisation de navigateur grâce à un système simple de référencement d'éléments, éliminant le besoin de sélecteurs complexes ou de requêtes XPath.

Prend en charge: Claude Codex Code(CC)
🥉 73 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "agent-browser". Open https://example.com and show me interactive elements

Résultat attendu:

Session created: abc123

Interactive elements:
@e1 [a] 'Home' href='/'
@e2 [input type='text'] placeholder='Search'
@e3 [button] 'Submit'

Screenshot saved to: /tmp/screenshot.png

Utilisation de "agent-browser". Click the search button and wait for results

Résultat attendu:

Action completed: clicked @e3
Waiting for page load...
Snapshot updated: 5 new elements found

Current URL: https://example.com/search?q=test

Utilisation de "agent-browser". Extract all headlines from the page

Résultat attendu:

Executing JavaScript: document.querySelectorAll('h2').map(h => h.textContent)

Result: ['Introduction', 'Features', 'Pricing', 'Contact']
Screenshot saved

Audit de sécurité

Sûr
v1 • 3/5/2026

All 606 static findings are false positives. The skill contains only documentation (markdown files) and template shell scripts. The external_commands findings are code examples in markdown showing users how to use the infsh CLI tool. The network findings are example URLs in documentation. The filesystem findings are example file paths. The skill itself does not execute any commands - it provides documentation for a third-party CLI tool (inference.sh). Users execute the commands themselves, not the skill.

10
Fichiers analysés
2,312
Lignes analysées
3
résultats
1
Total des audits
Audité par: claude

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
31
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Tests automatisés de formulaires

Les ingénieurs QA peuvent automatiser les workflows de soumission de formulaires sur plusieurs navigateurs, testant la logique de validation et la gestion des erreurs sans clics manuels

Extraction de données d'applications web

Les chercheurs peuvent extraire des données structurées d'applications web nécessitant une connexion, naviguant à travers des sessions authentifiées pour extraire des rapports ou des tableaux de bord

Tests de régression

Les développeurs peuvent créer des scripts d'automatisation de navigateur reproductibles pour vérifier les flux utilisateur critiques comme les processus de paiement ou l'inscription de comptes après les changements de code

Essayez ces prompts

Ouvrir une page web
Open https://example.com and show me all interactive elements on the page
Remplir et soumettre un formulaire
Fill in the login form with username 'user@example.com' and password 'secret123', then click the submit button
Extraire des données avec JavaScript
Navigate to https://example.com/data and execute JavaScript to extract all product names and prices into a structured format
Enregistrer une vidéo de débogage
Open a browser session with video recording enabled, navigate through the checkout flow, and save the video for debugging

Bonnes pratiques

  • Toujours recapturer après la navigation sur la page pour obtenir des références d'éléments fraîches, car les références @e deviennent invalides lorsque le DOM change
  • Utiliser des variables d'environnement pour les identifiants sensibles au lieu de les coder en dur dans les scripts d'automatisation
  • Fermer les sessions de navigateur une fois terminé pour libérer des ressources et récupérer les vidéos enregistrées
  • Commencer avec l'enregistrement vidéo activé pendant le développement, puis le désactiver pour les exécutions en production pour améliorer les performances

Éviter

  • Ne pas réutiliser les références d'éléments après avoir cliqué sur des liens ou soumis des formulaires - toujours appeler snapshot pour obtenir de nouvelles références
  • Éviter les longues durées de session sans activité - les sessions peuvent expirer et perdre leur état
  • Ne jamais commettre d'identifiants ou de clés API dans les scripts d'automatisation utilisant cette compétence
  • Ne pas tenter d'interagir avec des éléments avant qu'ils ne soient visibles dans la fenêtre d'affichage

Foire aux questions

Do I need to install anything to use this skill?
Oui, vous avez besoin de l'outil CLI inference.sh (infsh) installé. Exécutez 'npx skills add inference-sh/skills@agent-tools' pour les instructions d'installation.
What happens to my element references after I click a link?
Les références d'éléments (@e) sont invalidées après toute navigation ou changement DOM. Appelez toujours la fonction snapshot pour obtenir des références fraîches après la navigation.
Can I use this to scrape data from websites?
Oui, vous pouvez naviguer vers des pages, exécuter du JavaScript pour extraire des données et capturer des captures d'écran. La compétence prend en charge les sessions authentifiées pour extraire du contenu protégé.
How do I handle login forms with two-factor authentication?
La compétence prend en charge l'intervention manuelle pour la 2FA - vous pouvez mettre en pause l'automatisation pour entrer des codes, ou utiliser des outils TOTP pour générer des codes par programmation. Voir authentication.md pour des exemples.
Is my browsing activity private?
La compétence utilise le service inference.sh pour exécuter les commandes du navigateur. Consultez leur politique de confidentialité pour plus de détails sur la gestion des données. Utilisez le support proxy pour une confidentialité supplémentaire.
Can I run multiple browser sessions in parallel?
Oui, chaque session a un session_id unique. Vous pouvez créer plusieurs sessions et les exécuter simultanément pour des tests parallèles ou l'extraction de données.