azure-aigateway
Azure AI Gateway を APIM で構成する
Azure API Management で AI モデル、MCP サーバー、エージェントを安全に使用し制御します。このスキルでは、AI デプロイメントのレート制限、セマンティックキャッシュ、コンテンツセキュリティ、ロードバランシングの設定を支援します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「azure-aigateway」を使用しています。 レート制限付きで Azure AI Gateway をセットアップ
期待される結果:
- Basicv2 SKU で APIM インスタンスを作成
- トークンレート制限を構成:サブスクリプションごとに 1 分あたり 500 トークン
- 0.8 しきい値でセマンティックキャッシュを追加
- ゲートウェイ URL: https://apim-aigateway.azure-api.net
「azure-aigateway」を使用しています。 AI エンドポイントにコンテンツセキュリティを追加
期待される結果:
- 8 つの重大度カテゴリでコンテンツセキュリティポリシーを構成
- ジェイルブレイク検出を有効化(shield-prompt=true)
- しきい値 4 でカテゴリをブロック:Hate、Sexual、SelfHarm、Violence
- 受信リクエストにポリシーを適用
セキュリティ監査
安全This is an official Microsoft skill for configuring Azure API Management as an AI Gateway. All static findings are false positives: external_commands are legitimate Azure CLI commands for infrastructure deployment, network findings are Microsoft documentation URLs, and 'jailbreak' references describe a content safety security feature that detects/blocks jailbreak attempts, not a vulnerability.
リスク要因
⚙️ 外部コマンド (1)
🌐 ネットワークアクセス (1)
品質スコア
作れるもの
AI モデルアクセスを保護
Azure OpenAI または AI Foundry デプロイメントにレート制限、トークンクォータ、認証を追加
キャッシュで AI コストを削減
セマンティックキャッシュを実装して類似のプロンプトをキャッシュし、AI サービスへの API 呼び出しを削減
API を MCP サーバーに変換
既存の API を Model Context Protocol サーバーとして公開し、AI エージェントのツール検出を可能に
これらのプロンプトを試す
eastus2 リージョンの rg-aigateway リソースグループに Basicv2 SKU で Azure AI Gateway 用の API Management をセットアップ
AI Gateway にトークンレート制限を追加。サブスクリプションごとに 1 分あたり 500 トークンに制限
API Management インスタンスで 0.8 の類似度しきい値と 120 秒の TTL でセマンティックキャッシュを構成
有害コンテンツのブロックと重大度しきい値 4 でジェイルブレイク試行を検出するコンテンツセキュリティフィルタリングを追加
ベストプラクティス
- より高速なデプロイ(5 ~ 10 分)と低コストのために Basicv2 SKU を使用
- バックエンド認証に API キーの代わりに管理対象 ID を有効化
- 最適なヒット率のために 0.7 ~ 0.8 しきい値でセマンティックキャッシュを構成
- コスト追跡とモニタリングのために azure-openai-emit-token-metric を使用
回避
- Basicv2 で要件を満たす場合に Premium SKU を使用(デプロイが遅くなります)
- 管理対象 ID の代わりに API キーをハードコード
- score-threshold を高く設定しすぎる(>0.9)とキャッシュヒットが発生しません
- 本番 AI デプロイメントでコンテンツセキュリティモニタリングを無効化
よくある質問
Azure AI Gateway とは何ですか?
どの APIM SKU を使用すべきですか?
セマンティックキャッシュはどのようにコストを削減しますか?
API を MCP サーバーに変換できますか?
コンテンツセキュリティはどのように動作しますか?
管理対象 ID は必要ですか?
開発者の詳細
作成者
microsoftライセンス
MIT
リポジトリ
https://github.com/microsoft/github-copilot-for-azure/tree/main/plugin/skills/azure-aigateway/参照
main