agent-browser
Automatiser les navigateurs web pour les agents IA
También disponible en: toolshell,inference-sh-8,inferencesh,inference-sh-0,inference-sh-9,skillssh,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs
Permettre aux assistants IA d'interagir avec les sites web, remplir des formulaires, extraire des données et effectuer des tâches d'automatisation web par programme. Contrôlez les navigateurs headless via de simples commandes CLI avec gestion de session et enregistrement vidéo.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "agent-browser". Open https://example.com and show available elements
Resultado esperado:
- Session started: sess_abc123
- Page loaded: https://example.com
- Interactive elements found:
- @e1 [h1] "Example Domain"
- @e2 [p] "This domain is for use in documentation"
- @e3 [a] "Learn more" href="https://iana.org/domains/example"
- Screenshot captured successfully
Usando "agent-browser". Fill form and submit
Resultado esperado:
- Filled @e1 with: John Doe
- Filled @e2 with: john@example.com
- Clicked @e3 (Submit button)
- Navigation detected - re-snapshot recommended
- Form submission confirmed - thank you page displayed
Auditoría de seguridad
Riesgo bajoStatic analyzer flagged 606 patterns in documentation files (markdown and shell templates). All findings are false positives: shell command patterns appear in documentation examples showing how to use the inference.sh CLI, not in executable skill code. Network URLs point to legitimate services (inference.sh, example domains). Path references are documentation placeholders. The skill legitimately uses bash commands to invoke the infsh CLI for browser automation via the allowed-tools mechanism.
Problemas de riesgo bajo (3)
Factores de riesgo
🌐 Acceso a red (5)
📁 Acceso al sistema de archivos (3)
⚙️ Comandos externos (5)
Puntuación de calidad
Lo que puedes crear
Soumission automatisée de formulaires
Remplir et soumettre des formulaires web pour la saisie de données, l'inscription ou les processus de contact. Prend en charge les commentaires de validation et la gestion des erreurs.
Extraction de données web
Extraire des données structurées de sites web pour la recherche, la surveillance des prix ou l'agrégation de contenu. Capture des captures d'écran en même temps que le contenu extrait.
Tests de bout en bout
Tester les flux de travail des applications web en simulant les interactions utilisateur. Enregistrer les sessions à des fins de débogage et de documentation.
Prueba estos prompts
Ouvrez l'URL https://example.com et prenez une capture d'écran de la page complète. Montrez-moi quels éléments sont disponibles pour l'interaction.
Naviguez vers le formulaire de contact sur https://example.com/contact. Remplissez le champ nom avec 'John Doe', l'email avec 'john@example.com', le message avec 'Bonjour', puis soumettez le formulaire. Confirmez que la soumission a réussi.
Ouvrez https://news.example.com et extrayez tous les titres d'articles de la page d'accueil. Prenez une capture d'écran de la page et enregistrez le texte extrait dans un fichier. Gardez la session ouverte pour les requêtes de suivi.
Démarrez une session de navigateur enregistrée. Naviguez vers la page de connexion, remplissez les identifiants à partir des variables d'environnement, soumettez et vérifiez que l'authentification a réussi. Naviguez vers le tableau de bord, extrayez le message de bienvenue et les données utilisateur, puis fermez et retournez le fichier vidéo.
Mejores prácticas
- Capturez toujours les références aux éléments après la navigation car les refs deviennent invalides lors des changements de page
- Utilisez des variables d'environnement pour les identifiants et les données sensibles, ne les codez jamais en dur dans les modèles
- Activez l'enregistrement vidéo uniquement pour le débogage afin de réduire la surcharge des ressources
- Fermez explicitement les sessions ou utilisez des traps de nettoyage pour éviter les fuites de ressources
Evitar
- Coder en dur les noms d'utilisateur, mots de passe ou clés API directement dans les fichiers de script
- Supposer que les refs d'éléments persistent entre lesChargement de pages sans nouvelle capture
- Enregistrer ou afficher des valeurs sensibles comme les mots de passe ou les jetons de session
- Laisser les sessions de navigateur ouvertes après la fin du flux de travail