技能 rag-engineer

📦

rag-engineer

Name: rag-engineer
Author: sickn33

安全

构建生产级RAG系统

RAG系统常因分块策略不当和简单检索而失败。本技能提供语义分块、混合检索和上下文优化的专家级模式，帮助构建生产级检索系统。

支持: Claude Codex Code(CC)

⚠️ 63 差

下载技能 ZIP

在 Claude 中上传

前往设置 → 功能 → 技能 → 上传技能

开启并开始使用

测试它

正在使用“rag-engineer”。 How should I chunk PDF documents with headers and tables for a RAG system?

预期结果:

使用尊重文档结构的语义分块：(1) 解析PDF以提取标题、段落和表格边界，(2) 在保留标题元数据的同时按段落级别分块，(3) 在块之间包含10-20%的重叠以保持上下文连续性，(4) 存储结构元数据以便在检索期间过滤。这种方法比固定令牌分块更好地保持意义。

正在使用“rag-engineer”。 My RAG system returns relevant documents but the answers are still poor. How do I debug this?

预期结果:

将检索评估与生成分离：(1) 通过手动检查top-k结果来检查检索精度，(2) 在测试集上测量命中率和MRR，(3) 如果检索看起来良好，问题在于你的提示或LLM选择。常见修复：在初始检索和最终生成之间添加重排序步骤。

安全审计

安全

v1 • 2/24/2026

All 16 static findings evaluated as false positives. The skill is a legitimate RAG (Retrieval-Augmented Generation) engineering documentation skill. External commands flagged are markdown code fence syntax (backticks) showing JavaScript examples. Cryptographic and reconnaissance warnings match keywords in context of semantic search and data pipelines, not security-relevant code.

已扫描文件

分析行数

发现项

审计总数

严重问题 (3)

SKILL.md:38-91

External Commands - False Positive

Markdown code fence syntax (backticks) containing JavaScript code examples. Lines 38-91 contain documentation examples for semantic chunking, hierarchical retrieval, and hybrid search implementations. No actual shell or Ruby execution.

SKILL.md:3 SKILL.md:21 SKILL.md:94

Weak Cryptographic Algorithm - False Positive

Scanner incorrectly matches keywords: 'generation' (in Retrieval-Augmented Generation), 'pipeline' (data pipeline), 'execute' (workflow). No cryptographic code present.

SKILL.md:24 SKILL.md:57 SKILL.md:81 SKILL.md:87

System Reconnaissance - False Positive

Scanner flags 'search' in context of semantic search and hybrid search. This is vector search in RAG systems, not network reconnaissance.

审计者: claude

质量评分

架构

100

可维护性

内容

社区

安全

100

规范符合性

你能构建什么

构建文档问答系统

创建基于RAG的问答系统，能够从大型文档集合中准确检索相关上下文

提升现有RAG准确性

使用高级分块和混合检索诊断并修复现有RAG实现中的检索质量问题

设计多跳推理系统

构建能够回答需要来自多个源文档信息的复杂问题的系统

试试这些提示

基础RAG模式查询

对于RAG系统，我应该如何对[文档类型]进行分块？哪些策略可以保留意义和上下文？

混合检索实现

设计一个结合BM25关键词匹配与向量相似度的混合检索系统。我如何融合这些分数？

检索评估

如何独立于LLM生成来评估检索系统？我应该跟踪哪些指标？

上下文窗口优化

最佳实践

始终使用命中率和MRR等指标独立于生成质量评估检索质量
使用尊重文档结构的语义分块，而非固定令牌计数
实现混合检索以结合语义理解与精确关键词匹配

避免

无论内容结构如何都使用固定大小分块——这会破坏句子并丢失意义
不加过滤地嵌入所有内容——增加成本并降低相关性
跳过检索评估——假设生成问题总是LLM的问题

常见问题

什么是语义分块？

语义分块按意义而非任意令牌计数来分割文档。它使用嵌入相似度检测主题转换，并保留标题和段落等文档结构。

何时应该使用混合检索？

当查询包含特定术语（名称、代码、精确短语）以及语义概念时使用混合检索。它结合用于关键词匹配的BM25和用于语义理解的向量相似度。

如何评估RAG检索质量？

使用命中率（top-k中的相关文档）、平均倒数排名（排名质量）和召回率等指标。创建带有真实相关文档的查询测试集。

什么是倒数排名融合？

倒数排名融合（RRF）将多个检索方法的排名相结合。它使用1/(rank + k)将排名转换为分数并求和，从而无需分数归一化即可获得统一排名。

如何处理超出上下文窗口的长文档？

使用分层检索：以多个粒度（段落、章节、文档）建立索引，先检索粗粒度结果，然后从相关章节获取细粒度块。

我应该使用什么嵌入模型？

根据使用场景选择。通用模型适用于大多数情况。存在用于代码、科学文本或多语言内容的专业模型。始终在特定数据上进行测试。

开发者详情

作者

sickn33

许可证

MIT

仓库

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/rag-engineer

引用

main

文件结构

📄 SKILL.md