Compétences vision-analysis
📦

vision-analysis

Risque faible

Analyser et décrire des images avec la vision IA

Extraire le sens des images sans effort manuel. Cette compétence analyse les photos, captures d'écran, graphiques et maquettes en utilisant le MiniMax vision MCP pour fournir des descriptions détaillées, l'extraction de texte et les commentaires sur la conception.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "vision-analysis". Analyser cette capture d'écran du tableau de bord produit

Résultat attendu:

  • ## Description de l'image
  • L'image montre un tableau de bord d'application web avec une barre latérale sombre sur la gauche contenant des liens de navigation pour Accueil, Analytique, Utilisateurs et Paramètres. La zone principale affiche trois cartes métriques en haut montrant le Revenu Total (48 250 $), les Utilisateurs Actifs (1 847) et le Taux de Conversion (3,2 %). Sous les cartes se trouve un graphique linéaire montrant les tendances de revenus sur les 30 derniers jours avec une tendance à la hausse.

Utilisation de "vision-analysis". Extraire tout le texte de cette capture d'écran de message d'erreur

Résultat attendu:

  • ## Texte extrait
  • Erreur 503 : Service Indisponible
  • Le serveur est temporairement incapable de traiter ta demande. Réessaie dans quelques instants.
  • Si le problème persiste, contacte le support à support@example.com

Audit de sécurité

Risque faible
v1 • 4/16/2026

Static analysis flagged 81 patterns across external_commands, network, filesystem, and env_access categories. After manual evaluation, all findings are false positives. The SKILL.md file is markdown documentation that contains configuration examples and code snippets for users to follow. The static scanner incorrectly treated markdown code blocks as executable Ruby/shell code. No actual code execution, network requests, credential access, or cryptographic operations exist in this file. URLs reference legitimate MiniMax API endpoints and documentation pages. Environment variable references are instructional placeholders for user configuration. Risk score reduced from 100/100 to low after context evaluation.

1
Fichiers analysés
175
Lignes analysées
1
résultats
1
Total des audits
Problèmes à risque faible (1)
Static analyzer false positives on markdown code blocks
The static scanner treated markdown code blocks in SKILL.md as executable code, generating 81 false positive findings. All detected patterns (external commands, network URLs, environment variables, filesystem paths, cryptographic algorithms) are documentation examples, not actual code. This indicates the scanner does not distinguish between markdown content and executable source files.
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
88
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Support d'accessibilité pour le contenu visuel

Générer des descriptions d'images détaillées pour rendre le contenu visuel accessible aux utilisateurs qui utilisent des lecteurs d'écran ou des interfaces basées sur du texte.

Extraction automatisée de données depuis les graphiques

Convertir les graphiques et diagrammes visuels en points de données et tendances structurées pour les rapports et l'analyse sans transcription manuelle.

Automatisation des retours sur la conception d'interface

Obtenir des critiques de conception structurées avec les points forts, les problèmes et les suggestions pour les maquettes et wireframes d'interface avant les tests utilisateurs.

Essayez ces prompts

Décrire une image
Décris cette image en détail. Inclue le sujet principal, l'arrière-plan, les couleurs et tout texte visible.
Extraire le texte d'une capture d'écran
Extraie tout le texte visible dans cette image. Préserve le formatage et la structure originaux. Si aucun texte n'est trouvé, dis-le moi.
Revoir une maquette d'interface
Revois cette conception d'interface. Liste les points forts, identifie les problèmes d'utilisabilité et fournis des suggestions spécifiques pour l'amélioration.
Extraire les données d'un graphique
Extraie toutes les données de ce graphique. Inclue le titre, les étiquettes des axes, les points de données avec les valeurs et un résumé de la tendance principale.

Bonnes pratiques

  • Utilise des images haute résolution pour de meilleurs résultats d'analyse, surtout pour l'OCR et l'extraction de données de graphiques
  • Sélectionne le mode d'analyse qui correspond à ton objectif pour obtenir la sortie la plus pertinente du modèle de vision
  • Vérifie le texte extrait et les données contre l'image originale quand l'exactitude est critique pour ton flux de travail

Éviter

  • N'utilise pas cette compétence pour les images contenant des informations sensibles comme des mots de passe, des données personnelles ou des documents confidentiels
  • Ne compte pas sur la sortie OCR pour les données critiques en matière de sécurité sans vérification manuelle des résultats
  • Ne suppose pas que le modèle peut lire du texte manuscrit ou des images fortement dégradées à faible contraste

Foire aux questions

Quels formats d'images sont pris en charge ?
La compétence prend en charge les formats JPEG, PNG, GIF, WebP, BMP et SVG. Les images jusqu'à 20 Mo peuvent être traitées.
Ai-je besoin d'un abonnement MiniMax ?
Oui. Un abonnement au plan MiniMax Token avec une clé API valide est nécessaire. La compétence ne peut pas être utilisée avec des clés de niveau gratuit.
Cette compétence peut-elle fonctionner avec des fichiers image locaux ?
Oui. Les chemins de fichiers locaux fonctionnent si le MiniMax MCP est configuré avec les permissions d'accès aux fichiers sur ton système.
Comment configurer l'outil MiniMax MCP ?
Exécute la commande de configuration pour ton environnement (Claude Code, Cursor ou OpenCode) avec ta clé API. La compétence fournit les commandes de configuration exactes pour chaque plateforme.
Cette compétence peut-elle lire du texte manuscrit ?
Le modèle est optimisé pour le texte imprimé. Le texte manuscrit peut ne pas être reconnu avec précision, surtout avec des styles d'écriture inhabituels.
Quels modes d'analyse sont disponibles ?
Cinq modes sont disponibles : describe (description générale de l'image), ocr (extraction de texte), ui-review (critique de conception), chart-data (extraction de données des graphiques) et object-detect (identifier les éléments dans les images).

Détails du développeur

Structure de fichiers

📄 SKILL.md