Question 1

RAG に最適な埋め込みモデルは何ですか？

Accepted Answer

ほとんどの RAG アプリケーションでは text-embedding-3-small がコストと品質の最適なバランスを提供します。最大の精度が必要な場合は text-embedding-3-large を使用してください。

Question 2

長い文書はどのように処理すればよいですか？

Accepted Answer

トークンベースまたはセマンティックなチャンキングを使用して文書を分割します。コンテキストを保持するために、オーバーラップ付きで 1 チャンクあたり 256-512 トークンを目指します。

Question 3

オフラインで埋め込みを使用できますか？

Accepted Answer

はい、BGE や E5 などの sentence-transformers モデルを使用できます。これらはローカルで実行されますが、より多くのセットアップと計算リソースが必要です。

Question 4

埋め込み次元を削減するにはどうすればよいですか？

Accepted Answer

OpenAI の text-embedding-3 モデルはネイティブの次元削減をサポートしています。他のモデルでは、PCA または Matryoshka Representation Learning を使用してください。

Question 5

どのような指標を追跡すべきですか？

Accepted Answer

検索品質については precision@k、recall@k、MRR、NDCG を追跡します。また、埋め込みあたりのレイテンシとコストも監視します。

Question 6

多言語コンテンツはどのように処理すればよいですか？

Accepted Answer

multilingual-e5-large や 100 以上の言語をネイティブにサポートする OpenAI の新しいモデルなどの多言語モデルを使用してください。

embedding-strategies

テストする