📦

agent-browser

Name: agent-browser
Author: inferen-sh

Risque faible 🌐 Accès réseau📁 Accès au système de fichiers⚙️ Commandes externes

Automatiser les navigateurs web pour les agents IA

Également disponible depuis: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,skillssh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

Permettre aux assistants IA d'interagir avec les sites web, remplir des formulaires, extraire des données et effectuer des tâches d'automatisation web par programme. Contrôlez les navigateurs headless via de simples commandes CLI avec gestion de session et enregistrement vidéo.

Prend en charge: Claude Codex Code(CC)

⚠️ 68 Médiocre

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "agent-browser". Open https://example.com and show available elements

Résultat attendu:

Session started: sess_abc123
Page loaded: https://example.com
Interactive elements found:
@e1 [h1] "Example Domain"
@e2 [p] "This domain is for use in documentation"
@e3 [a] "Learn more" href="https://iana.org/domains/example"
Screenshot captured successfully

Utilisation de "agent-browser". Fill form and submit

Résultat attendu:

Filled @e1 with: John Doe
Filled @e2 with: john@example.com
Clicked @e3 (Submit button)
Navigation detected - re-snapshot recommended
Form submission confirmed - thank you page displayed

Audit de sécurité

Risque faible

v1 • 3/20/2026

Static analyzer flagged 606 patterns in documentation files (markdown and shell templates). All findings are false positives: shell command patterns appear in documentation examples showing how to use the inference.sh CLI, not in executable skill code. Network URLs point to legitimate services (inference.sh, example domains). Path references are documentation placeholders. The skill legitimately uses bash commands to invoke the infsh CLI for browser automation via the allowed-tools mechanism.

Fichiers analysés

2,313

Lignes analysées

résultats

Total des audits

Problèmes à risque faible (3)

SKILL.md:17-58 references/authentication.md:20-297 references/commands.md:9-271

External Command Execution in Documentation

Shell command patterns (backticks, command substitution) detected in markdown documentation files. These are instructional examples showing users how to invoke the infsh CLI, not executable code within the skill itself. Pattern is benign when contained in documentation.

SKILL.md:11-15 references/proxy-support.md:23-259

Hardcoded URLs in Documentation

Multiple URLs detected in documentation files including inference.sh service endpoints and example.com domains. These are legitimate service URLs and documentation placeholders, not malicious endpoints.

SKILL.md:164 templates/authenticated-session.sh:30

Path References in Examples

Path traversal-like sequences detected in documentation and templates. These are placeholder paths (/path/to/file) showing users where to substitute their own values, not actual path traversal vulnerabilities.

Facteurs de risque

🌐 Accès réseau (5)

SKILL.md:11 SKILL.md:15 SKILL.md:21 references/authentication.md:25 references/authentication.md:71

📁 Accès au système de fichiers (3)

SKILL.md:164 templates/authenticated-session.sh:30 templates/capture-workflow.sh:28

⚙️ Commandes externes (5)

SKILL.md:9 SKILL.md:15 SKILL.md:17-58 templates/authenticated-session.sh:40-43 templates/capture-workflow.sh:28-31

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Soumission automatisée de formulaires

Remplir et soumettre des formulaires web pour la saisie de données, l'inscription ou les processus de contact. Prend en charge les commentaires de validation et la gestion des erreurs.

Extraction de données web

Extraire des données structurées de sites web pour la recherche, la surveillance des prix ou l'agrégation de contenu. Capture des captures d'écran en même temps que le contenu extrait.

Tests de bout en bout

Tester les flux de travail des applications web en simulant les interactions utilisateur. Enregistrer les sessions à des fins de débogage et de documentation.

Essayez ces prompts

Navigation de base et capture d'écran

Ouvrez l'URL https://example.com et prenez une capture d'écran de la page complète. Montrez-moi quels éléments sont disponibles pour l'interaction.

Automatisation de formulaires

Naviguez vers le formulaire de contact sur https://example.com/contact. Remplissez le champ nom avec 'John Doe', l'email avec 'john@example.com', le message avec 'Bonjour', puis soumettez le formulaire. Confirmez que la soumission a réussi.

Extraction de données avec session

Ouvrez https://news.example.com et extrayez tous les titres d'articles de la page d'accueil. Prenez une capture d'écran de la page et enregistrez le texte extrait dans un fichier. Gardez la session ouverte pour les requêtes de suivi.

Flux de travail authentifié avec vidéo

Démarrez une session de navigateur enregistrée. Naviguez vers la page de connexion, remplissez les identifiants à partir des variables d'environnement, soumettez et vérifiez que l'authentification a réussi. Naviguez vers le tableau de bord, extrayez le message de bienvenue et les données utilisateur, puis fermez et retournez le fichier vidéo.

Bonnes pratiques

Capturez toujours les références aux éléments après la navigation car les refs deviennent invalides lors des changements de page
Utilisez des variables d'environnement pour les identifiants et les données sensibles, ne les codez jamais en dur dans les modèles
Activez l'enregistrement vidéo uniquement pour le débogage afin de réduire la surcharge des ressources
Fermez explicitement les sessions ou utilisez des traps de nettoyage pour éviter les fuites de ressources

Éviter

Coder en dur les noms d'utilisateur, mots de passe ou clés API directement dans les fichiers de script
Supposer que les refs d'éléments persistent entre lesChargement de pages sans nouvelle capture
Enregistrer ou afficher des valeurs sensibles comme les mots de passe ou les jetons de session
Laisser les sessions de navigateur ouvertes après la fin du flux de travail

Foire aux questions

Qu'est-ce que inference.sh et ai-je besoin d'un compte ?

inference.sh est un service d'automatisation de navigateur qui fournit le backend pour ce skill. Oui, vous devez créer un compte et installer le CLI infsh. Exécutez 'infsh login' pour vous authentifier avant d'utiliser les commandes du navigateur.

Comment fonctionnent les références aux éléments (@e1, @e2) ?

Le navigateur attribue @e1, @e2, etc. aux éléments interactifs sur chaque instantané de page. Les références changent lors du rechargement de la page ou des mises à jour du DOM, alors appelez toujours snapshot après la navigation pour obtenir de nouvelles refs.

Ce skill peut-il contourner CAPTCHA ou la sécurité de connexion ?

Non. CAPTCHA nécessite une vérification humaine. Pour 2FA, vous pouvez soit générer des codes TOTP par programme si vous avez le secret, soit mettre en pause pour une intervention manuelle lorsque des codes SMS/hardware token sont nécessaires.

Où sont stockés les enregistrements vidéo ?

Les vidéos sont retournées comme des objets fichiers lorsque vous fermez une session avec record_video activé. Le fichier est fourni dans la réponse API et peut être enregistré ou traité par les commandes de skill suivantes.

Puis-je exécuter plusieurs sessions de navigateur en parallèle ?

Oui, chaque session a un session_id indépendant. Démarrez plusieurs sessions avec --session new et suivez leurs IDs séparément. N'oubliez pas de fermer chaque session pour libérer les ressources.

Cela fonctionne-t-il avec les navigateurs headless ?

Oui, le moteur Playwright sous-jacent s'exécute en mode headless par défaut. Cela signifie qu'aucune fenêtre de navigateur visible n'apparaît pendant l'automatisation, ce qui le rend adapté aux environnements serveur et aux pipelines CI/CD.