失效链接处理 |
检索增强生成(RAG) 优化策略篇 PDF 下载
相关截图:
![]() 主要内容:
一、RAG基础功能篇
1.1 RAG 工作流程
从RAG的工作流程看,RAG 模块有:文档块切分、文本嵌入模型、提示工程、大模型生成。
二、RAG 各模块有哪些优化策略?
• 文档块切分:设置适当的块间重叠、多粒度文档块切分、基于语义的文档切分、文档块摘要。
• 文本嵌入模型:基于新语料微调嵌入模型、动态表征。
• 提示工程优化:优化模板增加提示词约束、提示词改写。
• 大模型迭代:基于正反馈微调模型、量化感知训练、提供大context window的推理模型。
此外,还可对query召回的文档块集合进行处理,比如:元数据过滤[7]、重排序减少文档块数量[2]。
三、RAG 架构优化有哪些优化策略?
3.1 如何利用 知识图谱(KG)进行上下文增强?
3.1.1 典型RAG架构中,向量数据库进行上下文增强 存在哪些问题?
向量数据库进行上下文增强 存在问题:
1. 无法获取长程关联知识
2. 信息密度低(尤其当LLM context window较小时不友好)
3.1.2 如何利用 知识图谱(KG)进行上下文增强?
• 策略:增加一路与向量库平行的KG(知识图谱)上下文增强策略。
|