azure-aigateway
Configurer Azure AI Gateway avec APIM
Sécurisez et contrôlez les modèles IA, les serveurs MCP et les agents avec Azure API Management. Cette compétence aide à configurer la limitation de débit, le cache sémantique, la sécurité du contenu et l'équilibrage de charge pour les déploiements IA.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“azure-aigateway”。 Configurez une passerelle Azure AI avec limitation de débit
预期结果:
- Instance APIM créée avec SKU Basicv2
- Limitation de débit de tokens configurée : 500 tokens/minute par abonnement
- Cache sémantique ajouté avec seuil 0.8
- URL de la passerelle : https://apim-aigateway.azure-api.net
正在使用“azure-aigateway”。 Ajoutez la sécurité du contenu à mon point de terminaison IA
预期结果:
- Politique de sécurité du contenu configurée avec huit catégories de sévérité
- Détection des tentatives d'évasion activée (shield-prompt=true)
- Catégories bloquées : Haine, Sexuel, Auto-nuisance, Violence au seuil 4
- Politique appliquée aux requêtes entrantes
安全审计
安全This is an official Microsoft skill for configuring Azure API Management as an AI Gateway. All static findings are false positives: external_commands are legitimate Azure CLI commands for infrastructure deployment, network findings are Microsoft documentation URLs, and 'jailbreak' references describe a content safety security feature that detects/blocks jailbreak attempts, not a vulnerability.
风险因素
⚙️ 外部命令 (1)
🌐 网络访问 (1)
质量评分
你能构建什么
Sécuriser l'accès aux modèles IA
Ajouter une limitation de débit, des quotas de tokens et une authentification aux déploiements Azure OpenAI ou AI Foundry
Réduire les coûts IA avec le cache
Implémenter le cache sémantique pour mettre en cache les prompts similaires et réduire les appels API aux services IA
Convertir des API en serveurs MCP
Exposer les API existantes comme serveurs Model Context Protocol pour la découverte d'outils par les agents IA
试试这些提示
Configurez une passerelle Azure AI en utilisant API Management avec SKU Basicv2 dans le groupe de ressources rg-aigateway dans la région eastus2
Ajoutez une limitation de débit de tokens à ma passerelle IA. Limitez à 500 tokens par minute par abonnement
Configurez le cache sémantique sur mon instance API Management avec un seuil de similarité de 0.8 et un TTL de 120 secondes
Ajoutez un filtrage de sécurité du contenu pour bloquer le contenu nuisible et détecter les tentatives d'évasion avec un seuil de sévérité de 4
最佳实践
- Utiliser le SKU Basicv2 pour un déploiement plus rapide (5-10 min) et un coût réduit
- Activer l'identité managée au lieu des clés API pour l'authentification backend
- Configurer le cache sémantique avec un seuil de 0.7-0.8 pour des taux de succès optimaux
- Utiliser azure-openai-emit-token-metric pour le suivi des coûts et la surveillance
避免
- Utiliser le SKU Premium quand Basicv2 répond aux besoins (déploiement plus lent)
- Coder en dur les clés API au lieu d'utiliser l'identité managée
- Définir score-threshold trop élevé (>0.9) entraînant aucun succès de cache
- Désactiver la surveillance de sécurité du contenu dans les déploiements IA en production