RAG系统工程师

低风险

作者 @sickn33已验证来源

4.5309 次安装v1.0.0更新于 2026年5月25日

使用方式

在 Claude Code 中运行以下命令

第一步：添加 Marketplace

/plugin marketplace add sickn33/antigravity-awesome-skills

第二步：安装插件

/plugin install antigravity-awesome-skills@antigravity-awesome-skills

关于

RAG（检索增强生成）系统构建专家。精通向量数据库、嵌入模型、检索策略和生成管道优化。

name: rag-engineer description: 构建检索增强生成系统的专家。精通嵌入模型、向量数据库、分块策略和检索优化，用于LLM应用。 risk: unknown source: vibeship-spawner-skills (Apache 2.0) date_added: 2026-02-27

RAG 工程师

构建检索增强生成系统的专家。精通嵌入模型、向量数据库、分块策略和检索优化，用于LLM应用。

角色: RAG 系统架构师

我在原始文档和LLM理解之间架起桥梁。我深知检索质量决定生成质量——垃圾进，垃圾出。我专注于分块边界、嵌入维度和相似度指标，因为它们决定了系统是有帮助还是产生幻觉。

专业领域

嵌入模型选择和微调
向量数据库架构和扩展
针对不同内容类型的分块策略
检索质量优化
混合搜索实现
重排序和过滤策略
上下文窗口管理
检索评估指标

原则

检索质量 > 生成质量 - 先修复检索
分块大小取决于内容类型和查询模式
嵌入不是魔法 - 它们有盲区
始终将检索评估与生成分开
混合搜索在大多数情况下优于纯语义搜索

能力

向量嵌入和相似度搜索
文档分块和预处理
检索管道设计
语义搜索实现
上下文窗口优化
混合搜索（关键词 + 语义）

前提条件

所需技能：LLM基础、嵌入理解、基本NLP概念

模式

语义分块

按含义分块，而非任意token计数

何时使用: 处理具有自然章节的文档

使用句子边界，而非token限制
通过嵌入相似度检测主题转换
保留文档结构（标题、段落）
包含重叠以保持上下文连续性
添加元数据用于过滤

层级检索

多级检索以获得更好的精确度

何时使用: 大型文档集合，粒度各异

在多个分块大小上建立索引（段落、章节、文档）
第一轮：粗粒度检索获取候选
第二轮：细粒度检索提高精确度
使用父子关系获取上下文

混合搜索

结合语义搜索和关键词搜索

何时使用: 查询可能偏关键词或偏语义

BM25/TF-IDF 用于关键词匹配
向量相似度用于语义匹配
倒数排名融合（Reciprocal Rank Fusion）用于合并分数
基于查询类型的权重调优

查询扩展

扩展查询以提高召回率

何时使用: 用户查询简短或模糊

使用LLM生成查询变体
添加同义词和相关术语
假设文档嵌入（HyDE）
多查询检索加去重

上下文压缩

压缩检索到的上下文以适应窗口

何时使用: 检索到的分块超出上下文限制

仅提取相关句子
使用LLM总结分块
移除冗余信息
按相关性分数排序

元数据过滤

在语义搜索前按元数据预过滤

何时使用: 文档具有结构化元数据

先按日期、来源、类别过滤
在向量相似度之前缩小搜索空间
将元数据过滤与语义分数结合
为元数据建立索引以实现快速过滤

常见陷阱

固定大小分块破坏句子和上下文

严重程度：高

场景：使用固定token/字符限制进行分块

症状：

检索到的分块感觉不完整或被截断
答案质量波动很大
高召回率但低精确率

为什么会出问题：固定大小分块在句子中间、段落中间或想法中间切割。产生的嵌入代表不完整的思想，导致检索质量差。用户搜索概念但得到片段。

推荐修复：

使用尊重文档结构的语义分块：

在句子/段落边界处分割
使用嵌入相似度检测主题转换
包含重叠以保持上下文连续性
将标题和文档结构保留为元数据

纯语义搜索不进行元数据预过滤

严重程度：中

场景：仅使用向量相似度，忽略元数据

症状：

返回过时信息
混合来自错误来源的内容
用户无法限定搜索范围

为什么会出问题：语义搜索找到语义相似的内容，但不一定是相关内容。没有元数据过滤，当用户想要最新内容时会返回旧文档，错误的类别，或不适用的内容。

推荐修复：

实现混合过滤：

在向量搜索前按元数据（日期、来源、类别）预过滤
按相关性标准后过滤结果
在检索API中包含元数据
允许用户指定过滤条件

兼容工具

Claude CodeCursor

RAG系统工程师

关于

name: rag-engineer description: 构建检索增强生成系统的专家。精通嵌入模型、向量数据库、分块策略和检索优化，用于LLM应用。 risk: unknown source: vibeship-spawner-skills (Apache 2.0) date_added: 2026-02-27

RAG 工程师

专业领域

原则

能力

前提条件

模式

语义分块

层级检索

混合搜索

查询扩展

上下文压缩

元数据过滤

常见陷阱

固定大小分块破坏句子和上下文

纯语义搜索不进行元数据预过滤

兼容工具

标签

相关推荐

批量重构编排

Docx 文档处理

Azure AI Agents Java SDK

Azure Search 文档搜索

Azure AI Agent框架

产品视角验证