Habilidades agent-browser
📦

agent-browser

Riesgo bajo 🌐 Acceso a red📁 Acceso al sistema de archivos⚙️ Comandos externos

Automatiser les navigateurs web pour les agents IA

También disponible en: toolshell,inference-sh-8,inferencesh,inference-sh-0,inference-sh-9,skillssh,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

Permettre aux assistants IA d'interagir avec les sites web, remplir des formulaires, extraire des données et effectuer des tâches d'automatisation web par programme. Contrôlez les navigateurs headless via de simples commandes CLI avec gestion de session et enregistrement vidéo.

Soporta: Claude Codex Code(CC)
⚠️ 68 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "agent-browser". Open https://example.com and show available elements

Resultado esperado:

  • Session started: sess_abc123
  • Page loaded: https://example.com
  • Interactive elements found:
  • @e1 [h1] "Example Domain"
  • @e2 [p] "This domain is for use in documentation"
  • @e3 [a] "Learn more" href="https://iana.org/domains/example"
  • Screenshot captured successfully

Usando "agent-browser". Fill form and submit

Resultado esperado:

  • Filled @e1 with: John Doe
  • Filled @e2 with: john@example.com
  • Clicked @e3 (Submit button)
  • Navigation detected - re-snapshot recommended
  • Form submission confirmed - thank you page displayed

Auditoría de seguridad

Riesgo bajo
v1 • 3/20/2026

Static analyzer flagged 606 patterns in documentation files (markdown and shell templates). All findings are false positives: shell command patterns appear in documentation examples showing how to use the inference.sh CLI, not in executable skill code. Network URLs point to legitimate services (inference.sh, example domains). Path references are documentation placeholders. The skill legitimately uses bash commands to invoke the infsh CLI for browser automation via the allowed-tools mechanism.

10
Archivos escaneados
2,313
Líneas analizadas
6
hallazgos
1
Auditorías totales
Problemas de riesgo bajo (3)
External Command Execution in Documentation
Shell command patterns (backticks, command substitution) detected in markdown documentation files. These are instructional examples showing users how to invoke the infsh CLI, not executable code within the skill itself. Pattern is benign when contained in documentation.
Hardcoded URLs in Documentation
Multiple URLs detected in documentation files including inference.sh service endpoints and example.com domains. These are legitimate service URLs and documentation placeholders, not malicious endpoints.
Path References in Examples
Path traversal-like sequences detected in documentation and templates. These are placeholder paths (/path/to/file) showing users where to substitute their own values, not actual path traversal vulnerabilities.
Auditado por: claude

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
21
Comunidad
84
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Soumission automatisée de formulaires

Remplir et soumettre des formulaires web pour la saisie de données, l'inscription ou les processus de contact. Prend en charge les commentaires de validation et la gestion des erreurs.

Extraction de données web

Extraire des données structurées de sites web pour la recherche, la surveillance des prix ou l'agrégation de contenu. Capture des captures d'écran en même temps que le contenu extrait.

Tests de bout en bout

Tester les flux de travail des applications web en simulant les interactions utilisateur. Enregistrer les sessions à des fins de débogage et de documentation.

Prueba estos prompts

Navigation de base et capture d'écran
Ouvrez l'URL https://example.com et prenez une capture d'écran de la page complète. Montrez-moi quels éléments sont disponibles pour l'interaction.
Automatisation de formulaires
Naviguez vers le formulaire de contact sur https://example.com/contact. Remplissez le champ nom avec 'John Doe', l'email avec 'john@example.com', le message avec 'Bonjour', puis soumettez le formulaire. Confirmez que la soumission a réussi.
Extraction de données avec session
Ouvrez https://news.example.com et extrayez tous les titres d'articles de la page d'accueil. Prenez une capture d'écran de la page et enregistrez le texte extrait dans un fichier. Gardez la session ouverte pour les requêtes de suivi.
Flux de travail authentifié avec vidéo
Démarrez une session de navigateur enregistrée. Naviguez vers la page de connexion, remplissez les identifiants à partir des variables d'environnement, soumettez et vérifiez que l'authentification a réussi. Naviguez vers le tableau de bord, extrayez le message de bienvenue et les données utilisateur, puis fermez et retournez le fichier vidéo.

Mejores prácticas

  • Capturez toujours les références aux éléments après la navigation car les refs deviennent invalides lors des changements de page
  • Utilisez des variables d'environnement pour les identifiants et les données sensibles, ne les codez jamais en dur dans les modèles
  • Activez l'enregistrement vidéo uniquement pour le débogage afin de réduire la surcharge des ressources
  • Fermez explicitement les sessions ou utilisez des traps de nettoyage pour éviter les fuites de ressources

Evitar

  • Coder en dur les noms d'utilisateur, mots de passe ou clés API directement dans les fichiers de script
  • Supposer que les refs d'éléments persistent entre lesChargement de pages sans nouvelle capture
  • Enregistrer ou afficher des valeurs sensibles comme les mots de passe ou les jetons de session
  • Laisser les sessions de navigateur ouvertes après la fin du flux de travail

Preguntas frecuentes

Qu'est-ce que inference.sh et ai-je besoin d'un compte ?
inference.sh est un service d'automatisation de navigateur qui fournit le backend pour ce skill. Oui, vous devez créer un compte et installer le CLI infsh. Exécutez 'infsh login' pour vous authentifier avant d'utiliser les commandes du navigateur.
Comment fonctionnent les références aux éléments (@e1, @e2) ?
Le navigateur attribue @e1, @e2, etc. aux éléments interactifs sur chaque instantané de page. Les références changent lors du rechargement de la page ou des mises à jour du DOM, alors appelez toujours snapshot après la navigation pour obtenir de nouvelles refs.
Ce skill peut-il contourner CAPTCHA ou la sécurité de connexion ?
Non. CAPTCHA nécessite une vérification humaine. Pour 2FA, vous pouvez soit générer des codes TOTP par programme si vous avez le secret, soit mettre en pause pour une intervention manuelle lorsque des codes SMS/hardware token sont nécessaires.
Où sont stockés les enregistrements vidéo ?
Les vidéos sont retournées comme des objets fichiers lorsque vous fermez une session avec record_video activé. Le fichier est fourni dans la réponse API et peut être enregistré ou traité par les commandes de skill suivantes.
Puis-je exécuter plusieurs sessions de navigateur en parallèle ?
Oui, chaque session a un session_id indépendant. Démarrez plusieurs sessions avec --session new et suivez leurs IDs séparément. N'oubliez pas de fermer chaque session pour libérer les ressources.
Cela fonctionne-t-il avec les navigateurs headless ?
Oui, le moteur Playwright sous-jacent s'exécute en mode headless par défaut. Cela signifie qu'aucune fenêtre de navigateur visible n'apparaît pendant l'automatisation, ce qui le rend adapté aux environnements serveur et aux pipelines CI/CD.