スキル vector-database-engineer
🔍

vector-database-engineer

安全

スケーラブルなベクトル検索システムの構築

本番対応ベクトルデータベースとセマンティック検索を実装します。このスキルは、埋め込み戦略、インデックス最適化、最新のAIアプリケーションのためのRAGアーキテクチャに関する専門的ガイダンスを提供します。

対応: Claude Codex Code(CC)
📊 70 十分
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「vector-database-engineer」を使用しています。 セマンティック検索のために500ページのPDFをどのようにチャンキングしますか?

期待される結果:

再帰的文字分割を使用し、1000〜1500文字のチャンクと200文字のオーバーラップを使用してください。これにより、セマンティックな一貫性を維持しながらコンテキストが保持されます。技術ドキュメントの場合、セクション境界を尊重する構造感知チャンキングを検討してください。

「vector-database-engineer」を使用しています。 本番環境におけるPineconeとWeaviateを比較してください

期待される結果:

Pineconeは運用オーバーヘッドゼロで管理されたスケーラビリティを提供しますが、ベンダーロックインがあります。Weaviateはハイブリッド検索が組み込まれた自己ホスティングの柔軟性を提供しますが、インフラ管理が必要です。迅速な開発にはPinecone、スケールでのコスト管理にはWeaviateを選択してください。

セキュリティ監査

安全
v1 • 2/25/2026

All static analysis findings are false positives. The skill contains only documentation text with no executable code, network requests, or security risks. The 'external_commands' flag was triggered by the word 'open' in a documentation sentence, not actual command execution. This is a legitimate educational skill about vector database engineering.

1
スキャンされたファイル
63
解析された行数
0
検出結果
1
総監査数
セキュリティ問題は見つかりませんでした
監査者: claude

品質スコア

38
アーキテクチャ
100
保守性
85
コンテンツ
25
コミュニティ
100
セキュリティ
91
仕様準拠

作れるもの

RAGナレッジベースの構築

AIを活用した質問応答のためにドキュメントに対するセマンティック検索を設計する

レコメンデーションエンジンの実装

ベクトル埋め込みを使用した類似性ベースの製品レコメンデーションを作成する

ベクトル検索パフォーマンスの最適化

数百万のベクトルに対してインデックス設定とチャンキング戦略を調整する

これらのプロンプトを試す

ベクトルデータベースの選択
100万ベクトルを持つドキュメント検索システムのために、Pinecone、Weaviate、Qdrantの間で選択,帮助我选择
埋め込み戦略の設計
技術ドキュメントの埋め込みパイプラインを設計する。チャンキングサイズ、オーバーラップ、モデル選択を推奨する
HNSWインデックスの設定
500万ベクトルで90%リコールかつ50ms未満のレイテンシーを達成するためのHNSWインデックスパラメータを設定する
ハイブリッド検索の実装
製品検索のためにベクトル類似性とキーワードフィルタを組み合わせたハイブリッド検索を実装する

ベストプラクティス

  • 本番環境にデプロイする前に、常に特定のドメインで埋め込みモデルをテストしてください
  • 複雑なドキュメント構造の最適化の前に、シンプルなチャンキング戦略から始めてください
  • ベクトルドリフトを監視し、定期的な再埋め込みサイクルを計画してください
  • ベクトルクエリの前にメタデータフィルタを使用して検索空間を縮小してください

回避

  • 小さなモデルでユースケースが機能するかどうかをテストせずに、より大きな埋め込み次元を使用すること
  • オーバーラップなしでドキュメントをチャンキングし、セグメント間のコンテキストを失うこと
  • リコールテストをスキップし、レイテンシーのみを測定すること
  • ソーステキストやメタデータ参照なしで埋め込みを保存すること

よくある質問

HNSWとIVFインデックス有什么区别?
HNSW(Hierarchical Navigable Small World)はより高速なクエリを提供しますが、メモリ使用量が増えます。IVF(Inverted File)はメモリ使用量は少ないですが、クエリ速度が遅くなります。リアルタイムアプリケーションにはHNSW、コスト重視の大規模デプロイにはIVFを使用してください。
埋め込み次元を選択するにはどうすればいいですか?
より高い次元(1536)はより多くのセマンティックニュアンスを捉えますが、ストレージとレイテンシーが増加します。大多数の使用例では384〜768次元から始めてください。複雑なセマンティック関係があり、インフラストラクチャの予算十分な場合のみ1536を使用してください。
メタデータには前処理フィルタリングと後処理フィルタリングのどちらを使用する必要がありますか?
前処理フィルタリングは検索空間を縮小し、パフォーマンスを向上させますが、関連性のある結果を見落とす可能性があります。後処理フィルタリングはリコールを保証しますが、フィルタされた結果に対して計算を浪費します。厳密な制約には前処理フィルタリング、ソフトな喜好には後処理フィルタリングを使用してください。
どのベクトルデータベースを使用すべきですか?
管理されたシンプルさにはPinecone、ハイブリッド検索機能にはWeaviate、フィルタリングとパフォーマンスにはQdrant、PostgreSQLを既に使用している場合はpgvectorを選択してください。チームの専門知識とインフラストラクチャの好みに基づいて選択してください。
埋め込みドリフトへの対処方法は?
埋め込みドリフトは、データの分布が時間とともに変化する際に発生します。月次で検索品質メトリクスを監視し重大なアプリケーションには四半期の再埋め込みをスケジュールしてください。完全な移行前に古い埋め込みと新しい埋め込みを比較するためにA/Bテストを使用してください。
このスキルを使用してベクトルデータベースに直接クエリを実行できますか?
いいえ、このスキルはベクトルデータベースアーキテクチャと最適化のためのガイダンスとコード生成を提供します。クエリを実行したりデータベースに مباشرة接続したりすることはできません。提案されたコードはアプリケーションで実装する必要があります。

開発者の詳細

ファイル構成

📄 SKILL.md