Habilidades azure-ai-vision-imageanalysis-java
📦

azure-ai-vision-imageanalysis-java

Seguro

Crie aplicativos de análise de imagens com o Azure AI Vision Java SDK

Precisa adicionar legendas de imagens, extração de texto via OCR, detecção de objetos ou corte inteligente em seu aplicativo Java. Esta skill fornece padrões de código prontos para uso para integrar o Azure AI Vision SDK com gerenciamento adequado de credenciais e tratamento de erros.

Suporta: Claude Codex Code(CC)
🥉 72 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "azure-ai-vision-imageanalysis-java". Gerar legenda para image.jpg

Resultado esperado:

O Azure AI Vision SDK gera uma legenda como: 'Um grupo de pessoas sentadas em uma mesa de conferência discutindo uma apresentação' com uma pontuação de confiança de 0,92. O código mostra como extrair o texto e o valor de confiança.

A utilizar "azure-ai-vision-imageanalysis-java". Extrair texto de receipt.png

Resultado esperado:

Os resultados do OCR incluem blocos de texto estruturados com detalhes em nível de linha e palavra. Cada palavra mostra seu texto, pontuação de confiança (por exemplo, 0,98) e coordenadas do polígono delimitador para posicionamento preciso.

A utilizar "azure-ai-vision-imageanalysis-java". Detectar objetos em photo.jpg

Resultado esperado:

A detecção de objetos retorna uma matriz de objetos detectados. Cada objeto inclui tags com nomes (por exemplo, 'pessoa', 'notebook') e pontuações de confiança, além de coordenadas de caixa delimitadora (x, y, largura, altura) para desenhar caixas de detecção.

Auditoria de Segurança

Seguro
v1 • 2/24/2026

This is a legitimate Azure AI Vision SDK documentation skill for Java. Static analysis flagged many patterns but all are false positives: (1) External commands detected at lines 15-268 are Maven XML and Java code examples, not shell commands. (2) Network URLs at lines 102, 269, 281 are example/demo URLs and documentation links. (3) Environment variable access at lines 32-33 uses System.getenv() for secure credential management - this is the recommended secure practice. (4) High/blocker findings for 'weak cryptographic algorithm' are YAML metadata and table formatting, not cryptographic code. The skill uses proper security practices by reading Azure credentials from environment variables rather than hardcoding them.

1
Arquivos analisados
295
Linhas analisadas
4
achados
1
Total de auditorias
Problemas de Baixo Risco (4)
External Commands Detection - False Positive
Static analyzer flagged 38 instances of 'Ruby/shell backtick execution' at various lines (15-268). Upon manual review, these are Maven XML dependency definitions and Java code examples - NOT shell commands. The analyzer incorrectly identified XML tags like <groupId> and <artifactId> as shell backticks.
Hardcoded URLs - False Positive
Static analyzer flagged 3 hardcoded URLs. These are all legitimate: (1) Line 102: example.com demo URL in sample code, (2) Line 269: Azure endpoint template for environment configuration, (3) Line 281: Microsoft documentation link. No credential exfiltration risk.
Environment Variable Access - Legitimate Secure Practice
Static analyzer flagged System.getenv() calls at lines 32-33. This is the SECURE recommended practice for handling Azure credentials - reading from environment variables rather than hardcoding them in source code. This is NOT a security vulnerability.
Weak Cryptographic Algorithm - False Positive
Static analyzer flagged 'weak cryptographic algorithm' at lines 3, 65, 67, 281, 294. These are: Line 3 (YAML: 'risk: unknown'), lines 65-67 (Markdown table formatting), line 281 (Azure documentation URL), line 294 (skill description). No cryptographic code present.

Padrões Detectados

Critical Heuristic: Code Execution + Network + Credential Access - FALSE POSITIVE
Auditado por: claude

Pontuação de qualidade

38
Arquitetura
100
Manutenibilidade
87
Conteúdo
32
Comunidade
97
Segurança
100
Conformidade com especificações

O Que Você Pode Construir

Automatizar a digitalização de documentos

Extrair texto de documentos digitalizados, recibos e faturas para criar arquivos digitais pesquisáveis. Usar OCR para converter documentos em papel em texto editável.

Melhorar catálogos de produtos de e-commerce

Gerar automaticamente legendas de imagens de produtos e detectar objetos para melhor indexação de busca. Criar miniaturas cortadas de forma consistente para exibição uniforme do catálogo.

Recursos de acessibilidade de construção

Gerar descrições de imagens para usuários com deficiência visual. Fornecer texto alternativo automático para imagens em sistemas de gerenciamento de conteúdo.

Tente Estes Prompts

Legenda básica de imagem
Use o Azure AI Vision Java SDK para gerar uma legenda para a imagem no caminho de arquivo local /path/to/image.jpg. Mostre como configurar o cliente com variáveis de ambiente e imprimir o texto da legenda com pontuação de confiança.
Extrair texto de documento
Mostre-me como usar o Azure AI Vision SDK para executar OCR em uma imagem de documento digitalizado. Inclua código para iterar pelos blocos de texto detectados, linhas e palavras com seus polígonos delimitadores.
Análise de múltiplos recursos
Escreva código Java que analise uma imagem usando múltiplos recursos visuais: legenda, tags, objetos e leitura (OCR). Mostre como configurar as opções de análise para legendas neutras em gênero e especificar o idioma.
Processamento assíncrono de imagens
Demonstre como usar o cliente assíncrono no Azure AI Vision Java SDK para analisar imagens. Mostre o padrão de assinatura para lidar com resultados e erros assíncronos.

Melhores Práticas

  • Sempre armazene as credenciais do Azure em variáveis de nunca codificar chaves de API no código-fonte
  • Use clientes assíncronos para processamento de imagens de alto volume para melhorar a taxa de transferência
  • Trate HttpResponseException para tratamento de erros robusto e lógica de repetição

Evitar

  • Não codifique chaves de API ou URLs de endpoint em seus arquivos Java de origem
  • Não ignore o tratamento de erros - sempre capture e registre exceções do serviço Azure
  • Não processe imagens maiores que 20MB - redimensione antes da análise para evitar falhas

Perguntas Frequentes

Como me autentico com o Azure AI Vision?
Você pode autenticar usando uma chave de API com KeyCredential ou usar DefaultAzureCredential para suporte a identidade gerenciada. Armazene seu VISION_ENDPOINT e VISION_KEY em variáveis de ambiente.
Quais formatos de imagem são suportados?
O Azure AI Vision suporta formatos JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF e MPO. O tamanho da imagem deve ser inferior a 20MB com dimensões entre 50x50 e 16000x16000 pixels.
Posso analisar imagens de uma URL?
Sim, use o método analyzeFromUrl() para analisar imagens acessíveis via URLs HTTP. O SDK também suporta a análise de arquivos locais usando BinaryData.fromFile().
Quão preciso é o recurso de legenda?
As pontuações de confiança de legendas geralmente variam de 0,0 a 1,0. Pontuações mais altas indicam legendas mais confiáveis. Legendas Densas fornece múltiplas descrições para diferentes regiões da imagem.
Quais idiomas são suportados para OCR?
O OCR do Azure AI Vision suporta mais de 90 idiomas. Especifique o idioma em ImageAnalysisOptions usando setLanguage() para melhores resultados.
Isso funciona com Azure Stack local?
Sim, o Azure AI Vision SDK pode se conectar ao Azure Stack ou outras instâncias do Azure Cognitive Services definindo a URL de endpoint apropriada para seu serviço local.

Detalhes do Desenvolvedor

Estrutura de arquivos

📄 SKILL.md