技能 vector-database-engineer
🔍

vector-database-engineer

安全

构建可扩展的向量搜索系统

实现生产就绪的向量数据库和语义搜索。本技能在嵌入策略、索引优化以及现代 AI 应用的 RAG 架构方面提供专业指导。

支持: Claude Codex Code(CC)
🥉 74 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“vector-database-engineer”。 如何为语义搜索分块 500 页的 PDF?

预期结果:

使用递归字符文本分割,1000-1500 字符的分块和 200 字符的重叠。这可以在保持语义连贯性的同时保留上下文。对于技术文档,考虑尊重章节边界的结构感知分块。

正在使用“vector-database-engineer”。 比较 Pinecone 和 Weaviate 的生产环境表现

预期结果:

Pinecone 提供托管的可扩展性,运营开销为零,但存在供应商锁定。Weaviate 提供自托管的灵活性和内置的混合搜索,但需要基础设施管理。选择 Pinecone 进行快速开发,选择 Weaviate 实现规模化成本控制。

安全审计

安全
v1 • 2/25/2026

All static analysis findings are false positives. The skill contains only documentation text with no executable code, network requests, or security risks. The 'external_commands' flag was triggered by the word 'open' in a documentation sentence, not actual command execution. This is a legitimate educational skill about vector database engineering.

1
已扫描文件
63
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
85
内容
50
社区
100
安全
91
规范符合性

你能构建什么

构建 RAG 知识库

为文档设计语义搜索以实现 AI 驱动的问答

实现推荐引擎

使用向量嵌入创建基于相似性的产品推荐

优化向量搜索性能

针对数百万向量调优索引和分块策略

试试这些提示

选择向量数据库
帮助我在 Pinecone、Weaviate 和 Qdrant 之间为拥有 100 万向量的文档搜索系统做出选择
设计嵌入策略
为技术文档设计嵌入流水线。推荐分块大小、重叠和模型选择
配置 HNSW 索引
在 500 万向量上配置 HNSW 索引参数,实现 50ms 以下延迟的 90% 召回率
实现混合搜索
实现结合向量相似度和关键词过滤器的混合搜索用于产品搜索

最佳实践

  • 在生产部署前始终在您的特定领域测试嵌入模型
  • 在为复杂文档结构优化之前,先从简单的分块策略开始
  • 监控向量漂移并规划定期的重新嵌入周期
  • 使用元数据过滤在向量查询之前缩小搜索空间

避免

  • 在未经测试的情况下使用更大的嵌入维度,而没有验证较小模型是否适用于您的用例
  • 分块文档时不使用重叠,丢失片段之间的上下文
  • 跳过召回率测试,仅测量延迟
  • 存储嵌入时缺少源文本或元数据引用

常见问题

HNSW 和 IVF 索引有什么区别?
HNSW(分层可导航小世界)提供更快的查询速度但内存使用量更高。IVF(倒排文件)使用更少内存但查询速度较慢。实时应用使用 HNSW,成本敏感的大规模部署使用 IVF。
如何选择嵌入维度?
更高的维度(1536)可以捕获更多语义细节,但会增加存储和延迟。大多数用例从 384-768 维度开始。仅在存在复杂语义关系和充足基础设施预算时使用 1536。
元数据过滤应该使用预过滤还是后过滤?
预过滤可以缩小搜索空间并提高性能,但可能会遗漏相关结果。后过滤确保召回率但会在过滤结果上浪费计算。对严格约束使用预过滤,对软偏好使用后过滤。
应该使用哪个向量数据库?
Pinecone 用于托管简化,Weaviate 用于混合搜索功能,Qdrant 用于性能和过滤,如果您已经使用 PostgreSQL 则使用 pgvector。根据您的团队专业知识和基础设施偏好进行选择。
如何处理嵌入漂移?
当您的数据分布随时间变化时,会发生嵌入漂移。每月监控搜索质量指标,并为关键应用安排每季度重新嵌入。在完整迁移之前使用 A/B 测试比较新旧嵌入。
我可以使用此技能直接查询向量数据库吗?
不可以,此技能为向量数据库架构和优化提供指导及代码生成。它不执行查询或直接连接到您的数据库。您必须在应用程序中实现建议的代码。

开发者详情

文件结构

📄 SKILL.md