ML Engineer
専門家のガイダンスで本番向けMLシステムを構築
機械学習モデルを本番環境にデプロイするには、多くのチームが不足しているサービング、モニタリング、インフラストラクチャの専門知識が必要です。このスキルは、PyTorch 2.x や TensorFlow などの最新フレームワークを使用して、信頼性が高くスケーラブルな ML システムを構築するための実証済みのパターンを提供します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「ML Engineer」を使用しています。 50ms レイテンシ SLA での画像分類用モデルサービングアーキテクチャの設計
期待される結果:
- GPU インスタンスを使用した TorchServe による推奨アーキテクチャ
- スループット最適化のためのリクエストバッチ処理設定
- 繰り返し入力での予測キャッシュ用 Redis レイヤー
- キューディプスとレイテンシメトリクスに基づく自動スケーリングポリシー
- 障害時の優雅なデグラデーション用サーキットブレーカーパターン
「ML Engineer」を使用しています。 モデル比較のための A/B テストを実装する方法
期待される結果:
- ユーザー整合性のためのスティッキーセッションを使用したトラフィック分割戦略
- 2% の改善を検出するための統計的検出力の計算
- 悪影響を監視するためのガードレールメトリクス
- 早期停止基準を使用したシーケンシャルテストアプローチ
- ベースラインコンバージョン率に基づくサンプルサイズ推定
セキュリティ監査
安全Prompt-only skill with no executable code. Static analysis found 0 files with executable content and computed risk score of 0/100. The SKILL.md file contains only markdown documentation and AI assistant instructions for ML engineering tasks. No security concerns identified.
品質スコア
作れるもの
リアルタイムレコメンデーションシステム
Redis キャッシングと TorchServe 経由のモデルサービングを使用して、毎秒 10 万件の予測を処理する高スループットのレコメンデーションエンジンを設計します。
ML パイプラインの自動化
Apache Airflow または Kubeflow を使用してエンドツーエンドの ML パイプラインを構築し、データ処理、トレーニング、検証、デプロイを自動化します。
モデルパフォーマンスのモニタリング
本番環境でのデータドリフト、予測レイテンシ、ビジネスメトリクスを追跡するために、Prometheus と Grafana を使用した包括的なモニタリングを実装します。
これらのプロンプトを試す
model.pth として保存されたトレーニング済みの PyTorch モデルがあります。FastAPI と Docker を使用して REST API としてデプロイする方法を案内してください。ヘルスチェック、入力検証、基本ログを含めてください。
E コマースレコメンデーションシステム向けのフィーチャーストアアーキテクチャを設計してください。バッチ機能(ユーザーの購入履歴)とリアルタイム機能(セッションアクティビティ)の両方が必要です。ユースケースに基づいて Feast と Tecton を比較してください。
8x A100 GPU で 20 億パラメータのトラン��フォーマーモデルをトレーニングする必要があります。PyTorch FSDP または DeepSpeed を使用した分散トレーニング戦略を推奨してください。勾配チェックポイント、混合精度、通信最適化を含めてください。
毎秒 1 万件のリクエストを処理��る不正検出モデル向けの包括的なモニタリングシステムを設計してください。データドリフト検出、モデルパフォーマンストラッキング、アラートしきい値、自動ロールバックトリガーを���めてください。
ベストプラクティス
- ドリフトを早期に検出するために、モデル推論前に常に包括的な入力検証とデータ品質チェックを実装してください
- 再現可能な ML インフラストラクチャデプロイのためにインフラストラクチャ as コード(Terraform、CloudFormation)を使用してください
- 障害時にサービスを維持するために、フォールバックモデルとサーキットブレーカーで優雅なデグラデーションを設計してください
回避
- データドリフトやパフォーマンス劣化のモニタリングなしでモデルをデプロイすると、サイレント障害につながります
- モデルレジストリを使用する代わりに、アプリケーションコードでモデルパスやハイパーパラメータをハードコーディングしてください
- 同じインフラストラクチャでトレーニングと推論を実行すると、リースコンテンションと予測不可能なレイテンシが発生します