技能 embedding-strategies

📦

embedding-strategies

Name: embedding-strategies
Author: sickn33

安全

優化嵌入模型以進行語意搜尋

也可從以下取得: wshobson

此技能協助開發者選擇並實現正確的嵌入模型以進行向量搜尋，提供 OpenAI、Sentence Transformers 和領域特定管線的程式碼範本。

支援: Claude Codex Code(CC)

📊 71 充足

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「embedding-strategies」。如何在 text-embedding-3-large 和 text-embedding-3-small 之間選擇？

預期結果:

text-embedding-3-large：3072 維度，8191 tokens - 最適合高準確度需求
text-embedding-3-small：1536 維度，8191 tokens - 具成本效益的選項
複雜語意任務選擇 large，大量應用選擇 small

正在使用「embedding-strategies」。程式碼的最佳分塊策略是什麼？

預期結果:

使用 tree-sitter 解析程式碼結構
按函式、類別和方法分塊
包含周圍內容以改善檢索
考慮語言特定的分隔符

安全審計

安全

v1 • 2/24/2026

This skill provides educational content about embedding strategies for RAG applications. All static findings are false positives: code blocks are markdown documentation examples, URLs are legitimate documentation links, and no cryptographic algorithms or system reconnaissance behavior is present. Safe for publication.

已掃描檔案

494

分析行數

發現項

審計總數

未發現安全問題

審計者: claude

品質評分

架構

100

可維護性

內容

社群

100

安全

100

規範符合性

你能建構什麼

建立 RAG 應用程式

設定嵌入管線以進行檢索增強生成，包含最佳分塊和模型選擇

比較嵌入模型

根據維度、成本和效能評估不同的嵌入模型，適用於特定領域

優化向量搜尋

透過適當的預處理、分塊和嵌入配置改善語意搜尋品質

試試這些提示

基本嵌入設定

展示如何開始使用 OpenAI 嵌入進行 RAG 應用程式。包含批次處理和維度減少。

本地嵌入模型

如何使用 sentence-transformers 設定本地嵌入模型？包含 BGE 和 E5 模型以及適當的預處理。

分塊策略

我應該為技術文件使用什麼分塊策略？包含基於 token、基於句子和語意方法。

品質評估

如何評估嵌入的檢索品質？展示 precision、recall、MRR 和 NDCG 等指標。

最佳實務

將嵌入模型與您的特定使用案例匹配（程式碼、散文、多語言）
使用 cosine similarity 進行檢索時標準化嵌入
快取嵌入以避免重複查詢的重新計算

避免

為您的領域使用錯誤的模型（例如，為程式碼使用一般嵌入）
忽略 token 限制導致截斷和資訊丟失
在生產環境中混合嵌入模型會產生不相容的向量空間

常見問題

什麼是 RAG 的最佳嵌入模型？

text-embedding-3-small 為大多數 RAG 應用程式提供最佳的成本和品質平衡。當需要最高準確度時使用 text-embedding-3-large。

如何處理長文件？

使用基於 token 或語意的分塊將文件分割成塊。目標是每塊 256-512 tokens 並帶有重疊以保留內容。

我可以離線使用嵌入嗎？

可以，使用 sentence-transformers 模型如 BGE 或 E5。它們在本地運行但需要更多設定和計算資源。

如何減少嵌入維度？

OpenAI 的 text-embedding-3 模型支援原生維度減少。對於其他模型，使用 PCA 或 Matryoshka Representation Learning。

我應該追蹤哪些指標？

追蹤 precision@k、recall@k、MRR 和 NDCG 以評估檢索品質。同時監控延遲和每次嵌入的成本。

如何處理多語言內容？

使用多語言模型如 multilingual-e5-large 或 OpenAI 的新模型，它們原生支援 100+ 種語言。

開發者詳情

作者

sickn33

授權

MIT

儲存庫

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/embedding-strategies

引用

main

檔案結構

📄 SKILL.md