
关于
RAG(检索增强生成)实现工作流,涵盖嵌入选择、向量数据库搭建、分块策略和检索优化。
name: rag-implementation description: "RAG(检索增强生成)实现工作流,涵盖嵌入模型选择、向量数据库设置、分块策略和检索优化。" category: granular-workflow-bundle risk: safe source: personal date_added: "2026-02-27"
RAG 实现工作流
概述
专门用于实现 RAG(检索增强生成)系统的工作流,包括嵌入模型选择、向量数据库设置、分块策略、检索优化和评估。
何时使用此工作流
在以下情况下使用此工作流:
- 构建 RAG 驱动的应用程序
- 实现语义搜索
- 创建知识驱动的 AI
- 搭建文档问答系统
- 优化检索质量
工作流阶段
阶段 1:需求分析
需要调用的技能
ai-product- AI 产品设计rag-engineer- RAG 工程
操作步骤
- 定义用例
- 识别数据源
- 设定准确性要求
- 确定延迟目标
- 规划评估指标
复制粘贴提示词
Use @ai-product to define RAG application requirements
阶段 2:嵌入模型选择
需要调用的技能
embedding-strategies- 嵌入策略选择rag-engineer- RAG 模式
操作步骤
- 评估嵌入模型
- 测试领域相关性
- 衡量嵌入质量
- 考虑成本/延迟
- 选择模型
复制粘贴提示词
Use @embedding-strategies to select optimal embedding model
阶段 3:向量数据库设置
需要调用的技能
vector-database-engineer- 向量数据库similarity-search-patterns- 相似性搜索
操作步骤
- 选择向量数据库
- 设计 Schema
- 配置索引
- 建立连接
- 测试查询
复制粘贴提示词
Use @vector-database-engineer to set up vector database
阶段 4:分块策略
需要调用的技能
rag-engineer- 分块策略rag-implementation- RAG 实现
操作步骤
- 选择分块大小
- 实现分块逻辑
- 添加重叠处理
- 创建元数据
- 测试检索质量
复制粘贴提示词
Use @rag-engineer to implement chunking strategy
阶段 5:检索实现
需要调用的技能
similarity-search-patterns- 相似性搜索hybrid-search-implementation- 混合搜索
操作步骤
- 实现向量搜索
- 添加关键词搜索
- 配置混合搜索
- 设置重排序
- 优化延迟
复制粘贴提示词
Use @similarity-search-patterns to implement retrieval
Use @hybrid-search-implementation to add hybrid search
阶段 6:LLM 集成
需要调用的技能
llm-application-dev-ai-assistant- LLM 集成llm-application-dev-prompt-optimize- 提示词优化
操作步骤
- 选择 LLM 提供商
- 设计提示词模板
- 实现上下文注入
- 添加引用处理
- 测试生成质量
复制粘贴提示词
Use @llm-application-dev-ai-assistant to integrate LLM
阶段 7:缓存
需要调用的技能
prompt-caching- 提示词缓存rag-engineer- RAG 优化
操作步骤
- 实现响应缓存
- 设置嵌入缓存
- 配置 TTL
- 添加缓存失效策略
- 监控命中率
复制粘贴提示词
Use @prompt-caching to implement RAG caching
阶段 8:评估
需要调用的技能
llm-evaluation- LLM 评估evaluation- AI 评估
操作步骤
- 定义评估指标
- 创建测试数据集
- 衡量检索准确率
- 评估生成质量
- 迭代改进
复制粘贴提示词
Use @llm-evaluation to evaluate RAG system
RAG 架构
User Query -> Embedding -> Vector Search -> Retrieved Docs -> LLM -> Response
| | | |
Model Vector DB Chunk Store Prompt + Context
质量检查点
- [ ] 嵌入模型已选择
- [ ] 向量数据库已配置
- [ ] 分块已实现
- [ ] 检索正常工作
- [ ] LLM 已集成
- [ ] 评估通过
相关工作流包
ai-ml- AI/ML 开发ai-agent-development- AI 智能体database- 向量数据库
限制
- 仅在任务明确匹配上述范围时使用此技能。
- 不要将输出视为特定环境验证、测试或专家审查的替代品。
- 如果缺少必要的输入、权限、安全边界或成功标准,请停下来寻求澄清。
兼容工具
Claude CodeCursor
标签
AI与机器学习