このスキルは、開発者がベクトル検索に適した埋め込みモデルを選択し実装できるよう支援します。OpenAI、Sentence Transformers、およびドメイン固有のパイプライン用のコードテンプレートを提供します。
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "embedding-strategies". text-embedding-3-large と text-embedding-3-small のどちらを選択すべきですか?
النتيجة المتوقعة:
- text-embedding-3-large: 3072 次元、8191 トークン - 高精度が必要な場合に最適
- text-embedding-3-small: 1536 次元、8191 トークン - コスト効率の良いオプション
- 複雑なセマンティックタスクには large を、大量処理アプリケーションには small を選択
استخدام "embedding-strategies". コードに対する最適なチャンキング戦略は何ですか?
النتيجة المتوقعة:
- tree-sitter を使用してコード構造を解析
- 関数、クラス、メソッド単位でチャンキング
- より良い検索のために周囲のコンテキストを含める
- 言語固有のセパレータを検討
التدقيق الأمني
آمنThis skill provides educational content about embedding strategies for RAG applications. All static findings are false positives: code blocks are markdown documentation examples, URLs are legitimate documentation links, and no cryptographic algorithms or system reconnaissance behavior is present. Safe for publication.
درجة الجودة
ماذا يمكنك بناءه
RAG アプリケーションの構築
最適なチャンキングとモデル選択により、検索拡張生成のための埋め込みパイプラインを設定
埋め込みモデルの比較
特定のドメイン向けに、次元数、コスト、パフォーマンスに基づいて異なる埋め込みモデルを評価
ベクトル検索の最適化
適切な前処理、チャンキング、埋め込み設定により、セマンティック検索の品質を向上
جرّب هذه الموجهات
RAG アプリケーションで OpenAI 埋め込みを使用する方法を教えてください。バッチ処理と次元削減を含めてください。
sentence-transformers を使用してローカル埋め込みモデルを設定するにはどうすればよいですか?適切な前処理とともに BGE および E5 モデルを含めてください。
技術ドキュメントにはどのようなチャンキング戦略を使用すべきですか?トークンベース、文ベース、およびセマンティックなアプローチを含めてください。
検索用の埋め込み品質を評価するにはどうすればよいですか?precision、recall、MRR、NDCG などの指標を示してください。
أفضل الممارسات
- 埋め込みモデルを使用ケース(コード、文章、多言語)に合わせる
- 検索にコサイン類似度を使用する場合は埋め込みを正規化
- 繰り返しクエリに対して埋め込みをキャッシュして再計算を回避
تجنب
- ドメインに間違ったモデルを使用(例:コードに一般用埋め込み)
- トークン制限を無視して切り捨てと情報損失を引き起こす
- 本番環境で埋め込みモデルを混在させて互換性のないベクトル空間を作成
الأسئلة المتكررة
RAG に最適な埋め込みモデルは何ですか?
長い文書はどのように処理すればよいですか?
オフラインで埋め込みを使用できますか?
埋め込み次元を削減するにはどうすればよいですか?
どのような指標を追跡すべきですか?
多言語コンテンツはどのように処理すればよいですか?
تفاصيل المطور
المؤلف
sickn33الترخيص
MIT
المستودع
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/embedding-strategiesمرجع
main
بنية الملفات
📄 SKILL.md