Compétences azure-ai-vision-imageanalysis-java
📦

azure-ai-vision-imageanalysis-java

Sûr

Créer des applications d'analyse d'images avec le SDK Java Azure AI Vision

Besoin d'ajouter la génération de légendes d'images, l'extraction de texte OCR, la détection d'objets ou le recadrage intelligent à votre application Java. Cette compétence fournit des modèles de code prêts à l'emploi pour intégrer le SDK Azure AI Vision avec une gestion des identifiants appropriée et une gestion des erreurs.

Prend en charge: Claude Codex Code(CC)
🥉 75 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "azure-ai-vision-imageanalysis-java". Générer une légende pour image.jpg

Résultat attendu:

Le SDK Azure AI Vision génère une légende comme : 'Un groupe de personnes assises à une table de conférence discutant d'une présentation' avec un score de confiance de 0,92. Le code montre comment extraire le texte et la valeur de confiance.

Utilisation de "azure-ai-vision-imageanalysis-java". Extraire le texte de receipt.png

Résultat attendu:

Les résultats OCR incluent des blocs de texte structurés avec les détails au niveau des lignes et des mots. Chaque mot affiche son texte, son score de confiance (par exemple 0,98) et les coordonnées du polygone de délimitation pour un positionnement précis.

Utilisation de "azure-ai-vision-imageanalysis-java". Détecter des objets dans photo.jpg

Résultat attendu:

La détection d'objets retourne un tableau d'objets détectés. Chaque objet inclut des balises avec des noms (par exemple 'person', 'laptop') et des scores de confiance, plus les coordonnées de la boîte de délimitation (x, y, largeur, hauteur) pour dessiner les cadres de détection.

Audit de sécurité

Sûr
v1 • 2/24/2026

This is a legitimate Azure AI Vision SDK documentation skill for Java. Static analysis flagged many patterns but all are false positives: (1) External commands detected at lines 15-268 are Maven XML and Java code examples, not shell commands. (2) Network URLs at lines 102, 269, 281 are example/demo URLs and documentation links. (3) Environment variable access at lines 32-33 uses System.getenv() for secure credential management - this is the recommended secure practice. (4) High/blocker findings for 'weak cryptographic algorithm' are YAML metadata and table formatting, not cryptographic code. The skill uses proper security practices by reading Azure credentials from environment variables rather than hardcoding them.

1
Fichiers analysés
295
Lignes analysées
4
résultats
1
Total des audits
Problèmes à risque faible (4)
External Commands Detection - False Positive
Static analyzer flagged 38 instances of 'Ruby/shell backtick execution' at various lines (15-268). Upon manual review, these are Maven XML dependency definitions and Java code examples - NOT shell commands. The analyzer incorrectly identified XML tags like <groupId> and <artifactId> as shell backticks.
Hardcoded URLs - False Positive
Static analyzer flagged 3 hardcoded URLs. These are all legitimate: (1) Line 102: example.com demo URL in sample code, (2) Line 269: Azure endpoint template for environment configuration, (3) Line 281: Microsoft documentation link. No credential exfiltration risk.
Environment Variable Access - Legitimate Secure Practice
Static analyzer flagged System.getenv() calls at lines 32-33. This is the SECURE recommended practice for handling Azure credentials - reading from environment variables rather than hardcoding them in source code. This is NOT a security vulnerability.
Weak Cryptographic Algorithm - False Positive
Static analyzer flagged 'weak cryptographic algorithm' at lines 3, 65, 67, 281, 294. These are: Line 3 (YAML: 'risk: unknown'), lines 65-67 (Markdown table formatting), line 281 (Azure documentation URL), line 294 (skill description). No cryptographic code present.

Motifs détectés

Critical Heuristic: Code Execution + Network + Credential Access - FALSE POSITIVE
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
97
Sécurité
100
Conformité aux spécifications

Ce que vous pouvez construire

Automatiser la numérisation des documents

Extraire le texte des documents numérisés, reçus et factures pour créer des archives numériques consultables. Utiliser l'OCR pour convertir les documents papier en texte modifiable.

Améliorer les catalogues de produits e-commerce

Générer automatiquement des légendes pour les images de produits et détecter les objets pour une meilleure indexation de recherche. Créer des miniatures uniformément recadrées pour un affichage cohérent du catalogue.

Créer des fonctionnalités d'accessibilité

Générer des descriptions d'images pour les utilisateurs malvoyants. Fournir un texte alternatif automatique pour les images dans les systèmes de gestion de contenu.

Essayez ces prompts

Légende d'image basique
Utilisez le SDK Java Azure AI Vision pour générer une légende pour l'image au chemin de fichier local /path/to/image.jpg. Montrez comment configurer le client avec des variables d'environnement et afficher le texte de la légende avec le score de confiance.
Extraire le texte d'un document
Montrez-moi comment utiliser le SDK Azure AI Vision pour effectuer l'OCR sur une image de document numérisé. Incluez du code pour itérer à travers les blocs de texte détectés, les lignes et les mots avec leurs polygones de délimitation.
Analyse multifonction
Écrivez du code Java qui analyse une image en utilisant plusieurs fonctionnalités visuelles : caption, tags, objects et read (OCR). Montrez comment configurer les options d'analyse pour des légendes neutres et spécifier la langue.
Traitement d'images asynchrone
Démontrez comment utiliser le client asynchrone dans le SDK Java Azure AI Vision pour analyser les images. Montrez le modèle d'abonnement pour gérer les résultats asynchrones et les erreurs.

Bonnes pratiques

  • Stockez toujours les identifiants Azure dans des variables d'environnement, ne codez jamais en dur les clés API dans le code source
  • Utilisez des clients asynchrones pour le traitement d'images à volume élevé afin d'améliorer le débit
  • Gérez HttpResponseException pour une gestion robuste des erreurs et une logique de nouvelle tentative

Éviter

  • Ne codez pas en dur les clés API ou les URLs de point de terminaison dans vos fichiers sources Java
  • Ne ignorez pas la gestion des erreurs - capturez et journalisez toujours les exceptions de service Azure
  • Ne traitez pas d'images supérieures à 20 Mo - redimensionnez avant l'analyse pour éviter les échecs

Foire aux questions

Comment m'authentifier avec Azure AI Vision ?
Vous pouvez vous authentifier à l'aide d'une clé API avec KeyCredential ou utiliser DefaultAzureCredential pour la prise en charge de l'identité gérée. Stockez VISION_ENDPOINT et VISION_KEY dans des variables d'environnement.
Quels formats d'image sont pris en charge ?
Azure AI Vision prend en charge les formats JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF et MPO. La taille de l'image doit être inférieure à 20 Mo avec des dimensions comprises entre 50x50 et 16000x16000 pixels.
Puis-je analyser des images depuis une URL ?
Oui, utilisez la méthode analyzeFromUrl() pour analyser les images accessibles via des URLs HTTP. Le SDK prend également en charge l'analyse de fichiers locaux à l'aide de BinaryData.fromFile().
Quelle est la précision de la fonctionnalité de génération de légendes ?
Les scores de confiance des légendes vont généralement de 0,0 à 1,0. Des scores plus élevés indiquent des légendes plus fiables. Dense Captions fournit plusieurs descriptions pour différentes régions de l'image.
Quelles langues sont prises en charge pour l'OCR ?
L'OCR Azure AI Vision prend en charge plus de 90 langues. Spécifiez la langue dans ImageAnalysisOptions à l'aide de setLanguage() pour de meilleurs résultats.
Cela fonctionne-t-il avec Azure Stack sur site ?
Oui, le SDK Azure AI Vision peut se connecter à Azure Stack ou à d'autres instances Azure Cognitive Services en définissant l'URL de point de terminaison appropriée vers votre service local.

Détails du développeur

Structure de fichiers

📄 SKILL.md