Question 1

HNSWとIVFインデックス有什么区别？

Accepted Answer

HNSW（Hierarchical Navigable Small World）はより高速なクエリを提供しますが、メモリ使用量が増えます。IVF（Inverted File）はメモリ使用量は少ないですが、クエリ速度が遅くなります。リアルタイムアプリケーションにはHNSW、コスト重視の大規模デプロイにはIVFを使用してください。

Question 2

埋め込み次元を選択するにはどうすればいいですか？

Accepted Answer

より高い次元（1536）はより多くのセマンティックニュアンスを捉えますが、ストレージとレイテンシーが増加します。大多数の使用例では384〜768次元から始めてください。複雑なセマンティック関係があり、インフラストラクチャの予算十分な場合のみ1536を使用してください。

Question 3

メタデータには前処理フィルタリングと後処理フィルタリングのどちらを使用する必要がありますか？

Accepted Answer

前処理フィルタリングは検索空間を縮小し、パフォーマンスを向上させますが、関連性のある結果を見落とす可能性があります。後処理フィルタリングはリコールを保証しますが、フィルタされた結果に対して計算を浪費します。厳密な制約には前処理フィルタリング、ソフトな喜好には後処理フィルタリングを使用してください。

Question 4

どのベクトルデータベースを使用すべきですか？

Accepted Answer

管理されたシンプルさにはPinecone、ハイブリッド検索機能にはWeaviate、フィルタリングとパフォーマンスにはQdrant、PostgreSQLを既に使用している場合はpgvectorを選択してください。チームの専門知識とインフラストラクチャの好みに基づいて選択してください。

Question 5

埋め込みドリフトへの対処方法は？

Accepted Answer

埋め込みドリフトは、データの分布が時間とともに変化する際に発生します。月次で検索品質メトリクスを監視し重大なアプリケーションには四半期の再埋め込みをスケジュールしてください。完全な移行前に古い埋め込みと新しい埋め込みを比較するためにA/Bテストを使用してください。

Question 6

このスキルを使用してベクトルデータベースに直接クエリを実行できますか？

Accepted Answer

いいえ、このスキルはベクトルデータベースアーキテクチャと最適化のためのガイダンスとコード生成を提供します。クエリを実行したりデータベースに مباشرة接続したりすることはできません。提案されたコードはアプリケーションで実装する必要があります。

vector-database-engineer

テストする

セキュリティ監査

品質スコア

作れるもの

RAGナレッジベースの構築

レコメンデーションエンジンの実装

ベクトル検索パフォーマンスの最適化

これらのプロンプトを試す

ベストプラクティス

回避

よくある質問

開発者の詳細