下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「hybrid-search-implementation」。 用户在 API 文档中搜索'authentication error 401'
預期結果:
混合搜索返回同时匹配身份验证失败语义概念 AND 错误代码 401 精确匹配的文档,按组合相关性得分排名。
正在使用「hybrid-search-implementation」。 开发者在 SDK 文档中查询'how to paginate results'
預期結果:
向量搜索找到语义相关的分页模式,而关键词搜索确保结果中包含'limit'、'offset'、'cursor'术语的精确匹配。
安全審計
安全Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.
品質評分
你能建構什麼
RAG 系统开发者
通过结合语义向量搜索与技术术语和产品代码的精确关键词匹配,构建具有更高召回率的检索增强生成系统。
搜索引擎构建者
实现企业级搜索,同时处理概念性查询(通过嵌入)和精确术语匹配(通过 BM25),以获得全面的结果。
知识库架构师
创建文档搜索功能,在语义层面理解用户意图,同时仍能精确匹配错误代码、API 名称和版本号。
試試這些提示
我需要为我的 RAG 系统实现混合搜索。展示如何在 Python 中使用倒数排名融合来结合向量嵌入与关键词搜索。
帮助我使用 pgvector 进行嵌入和内置全文搜索在 PostgreSQL 中设置混合搜索。我需要 SQL 模式创建和带有 RRF 融合的查询示例。
展示如何配置 Elasticsearch 以进行混合搜索,结合稠密向量相似度与 BM25 文本搜索。包括索引映射、搜索查询和 Elasticsearch 8.x 的 RRF 配置。
构建一个完整的混合 RAG 流水线,使用向量和关键词搜索检索候选结果,用 RRF 融合结果,然后使用交叉编码器模型对 top 候选进行重排序。包含可配置权重的异步 Python 实现。
最佳實務
- 在你的数据集上实证调整融合权重 - RRF 与 k=60 是一个很好的起点,但最佳平衡取决于你的内容
- 始终为生产系统包含交叉编码器重排序 - 对于 top-k 候选,质量提升证明了额外延迟的合理性
- 在开发过程中记录单个得分和融合得分,以了解哪些查询从每种搜索方法中受益
避免
- 对需要精确匹配的领域(如产品代码、错误消息或版本号)仅使用向量搜索
- 在融合前获取过多候选,这会增加延迟而不会提高结果质量
- 假设固定融合权重适用于所有查询类型,而不进行 A/B 测试或查询级优化
常見問題
我应该何时使用 RRF 与线性融合?
在融合前我应该检索多少候选?
交叉编码器重排序值得计算成本吗?
我可以在现有向量数据库上使用混合搜索吗?
什么嵌入模型最适合混合搜索?
如何处理纯粹语义或纯粹基于关键词的查询?
開發者詳情
作者
sickn33授權
MIT
儲存庫
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementation引用
main
檔案結構