📦

ML Engineer

Name: ML Engineer
Author: sickn33

安全

専門家のガイダンスで本番向けMLシステムを構築

機械学習モデルを本番環境にデプロイするには、多くのチームが不足しているサービング、モニタリング、インフラストラクチャの専門知識が必要です。このスキルは、PyTorch 2.x や TensorFlow などの最新フレームワークを使用して、信頼性が高くスケーラブルな ML システムを構築するための実証済みのパターンを提供します。

対応: Claude Codex Code(CC)

⚠️ 68 貧弱

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「ML Engineer」を使用しています。 50ms レイテンシ SLA での画像分類用モデルサービングアーキテクチャの設計

期待される結果:

GPU インスタンスを使用した TorchServe による推奨アーキテクチャ
スループット最適化のためのリクエストバッチ処理設定
繰り返し入力での予測キャッシュ用 Redis レイヤー
キューディプスとレイテンシメトリクスに基づく自動スケーリングポリシー
障害時の優雅なデグラデーション用サーキットブレーカーパターン

「ML Engineer」を使用しています。モデル比較のための A/B テストを実装する方法

期待される結果:

ユーザー整合性のためのスティッキーセッションを使用したトラフィック分割戦略
2% の改善を検出するための統計的検出力の計算
悪影響を監視するためのガードレールメトリクス
早期停止基準を使用したシーケンシャルテストアプローチ
ベースラインコンバージョン率に基づくサンプルサイズ推定

セキュリティ監査

安全

v1 • 2/25/2026

Prompt-only skill with no executable code. Static analysis found 0 files with executable content and computed risk score of 0/100. The SKILL.md file contains only markdown documentation and AI assistant instructions for ML engineering tasks. No security concerns identified.

スキャンされたファイル

解析された行数

検出結果

総監査数

セキュリティ問題は見つかりませんでした

監査者: claude

品質スコア

アーキテクチャ

100

保守性

コンテンツ

コミュニティ

100

セキュリティ

仕様準拠

作れるもの

リアルタイムレコメンデーションシステム

Redis キャッシングと TorchServe 経由のモデルサービングを使用して、毎秒 10 万件の予測を処理する高スループットのレコメンデーションエンジンを設計します。

ML パイプラインの自動化

Apache Airflow または Kubeflow を使用してエンドツーエンドの ML パイプラインを構築し、データ処理、トレーニング、検証、デプロイを自動化します。

モデルパフォーマンスのモニタリング

本番環境でのデータドリフト、予測レイテンシ、ビジネスメトリクスを追跡するために、Prometheus と Grafana を使用した包括的なモニタリングを実装します。

これらのプロンプトを試す

初級: ML モデルデプロイの基礎

model.pth として保存されたトレーニング済みの PyTorch モデルがあります。FastAPI と Docker を使用して REST API としてデプロイする方法を案内してください。ヘルスチェック、入力検証、基本ログを含めてください。

中級: フィーチャーストアの��計

E コマースレコメンデーションシステム向けのフィーチャーストアアーキテクチャを設計してください。バッチ機能（ユーザーの購入履歴）とリアルタイム機能（セッションアクティビティ）の両方が必要です。ユースケースに基づいて Feast と Tecton を比較してください。

上級: 分散トレーニング戦略

8x A100 GPU で 20 億パラメータのトラン��フォーマーモデルをトレーニングする必要があります。PyTorch FSDP または DeepSpeed を使用した分散トレーニング戦略を推奨してください。勾配チェックポイント、混合精度、通信最適化を含めてください。

expert: 本番 ML モニタリング

毎秒 1 万件のリクエストを処理��る不正検出モデル向けの包括的なモニタリングシステムを設計してください。データドリフト検出、モデルパフォーマンストラッキング、アラートしきい値、自動ロールバックトリガーを���めてください。

ベストプラクティス

ドリフトを早期に検出するために、モデル推論前に常に包括的な入力検証とデータ品質チェックを実装してください
再現可能な ML インフラストラクチャデプロイのためにインフラストラクチャ as コード（Terraform、CloudFormation）を使用してください
障害時にサービスを維持するために、フォールバックモデルとサーキットブレーカーで優雅なデグラデーションを設計してください

回避

データドリフトやパフォーマンス劣化のモニタリングなしでモデルをデプロイすると、サイレント障害につながります
モデルレジストリを使用する代わりに、アプリケーションコードでモデルパスやハイパーパラメータをハードコーディングしてください
同じインフラストラクチャでトレーニングと推論を実行すると、リースコンテンションと予測不可能なレイテンシが発生します

よくある質問

このスキルはどの ML フレームワークをサポートしていますか？

PyTorch 2.x と TensorFlow 2.x を主にサポートしています。また、研究ワークロード向けの JAX/Flax、古典的 ML 向けの scikit-learn と勾配ブースティングライブラリ、LLM アプリケーション向けの Hugging Face Transformers もカバーしています。

このスキルはクラウド固有の ML サービスの役に立ちますか？

はい。AWS SageMaker、Azure ML、GCP Vertex AI、Databricks ML のガイダンスを提供します。各プラットフォームのインフラストラクチャ as コードテンプレートとベストプラクティスが含まれています。

このスキルはエッジデプロイ向けのモデル最適化に役立ちますか？

はい。エッジデバイス向けの TensorFlow Lite、PyTorch Mobile、ONNX Runtime をカバーしています。リソース制約環境向けの量子化、プルーニング、蒸留技術が含まれています。

本番 ML に推奨されるモニタリングツールは何ですか？

インフラストラクチャメトリクス向けの Prometheus と Grafana、ML 固有のモニタリング向けの Evidently AI または WhyLabs、カスタムビジネスメトリクスダッシュボードを推奨します。アラート設定ガイダンスが含まれています。

このスキルはモデルバージョニングとロールバックをどのように処理しますか？

MLflow Model Registry、DVC、Git LFS を使用したバージョン管理をカバーしています。ブルーグリーンデプロイ、カナリアリリース、パフォーマンスしきい値に基づく自動ロールバックの戦略を提供します。

このスキルは分散トレーニングセットアップの役に立ちますか？

はい。PyTorch DDP、FSDP、Horovod、DeepSpeed の設定を提供します。マルチノードセットアップ、勾配蓄積、混合精度トレーニング、通信最適化をカバーしています。

開発者の詳細

作成者

sickn33

ライセンス

MIT

リポジトリ

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/ml-engineer

参照

main

ファイル構成

📄 SKILL.md