检索增强生成(RAG:Retrieval-Augmented Generation)技术可追溯到2020年Facebook宣布的一篇论文:“Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”。它联合了消息检索和生成模型技术,经过引入外部常识库消息,处置常识密集型NLP义务的成果:问答、文本摘要等。
大模型RAG之启蒙
大型言语模型(LLMs)只管展现出了令人印象深入的才干,但它们在处置特定畛域或常识密集型义务时面临诸如发生幻觉(hallucination)、常识过期以及推理环节不透明和无法追溯等应战。
RAG技术经过整合外部数据库中的常识,作为处置这些疑问的有出路的打算。它增强了生成的准确性和可信度,特意是关于常识密集型义务,并准许继续的常识降级和整合特定畛域的消息。
大模型RAG**稀释成两个**阶段:
检索阶段:模型首先从外部常识库中检索与输入文本相关的消息。这个常识库可以是对大规模文本数据集启动索引处置后构成的数据库。
生成阶段:将检索到的消息作为输入,到一个生成模型中(如Llama3)。这个生成模型会基于输入消息,生成最终的照应或文本。
初级RAG之36技
从架构、模块、技术三个维度解说了整个大模型初级RAG企业落地全环节之技术要点,一个框架、10个模块、36种技术!对一些复杂**模块:分块、向量、重排也启动了系统性总结和详情!
Query了解(Query NLU):经常使用LLM作为基础引擎来重写用户Query以提高检索品质,触及Query用意识别、消歧、合成、形象等,总计7种技术。
Query路由(Query Routing):查问路由是LLM支持的决策步骤,依据给定的用户查问下一步该做什么,总计1种技术。
索引(Indexing):是RAG中比拟**的模块,包含文档解析(5种工具)、文档切块(5类)、嵌入模型(6类)、索引类型(3类)等外容,总计8种技术。
Query检索(Query Retrieval):重点关注除典型RAG的向量检索之外的图谱与相关数据库检索(NL2SQL),总计3种技术。
重排(Rerank):来自不同检索战略的结果往往须要重排对齐,包含重排器类型(5种),自训练畛域重排器等,总计3种技术。
生成(Generation):实践企业落地会遇到生成重复、幻觉、迟滞、赞美、溯源等疑问,触及到RLHF、偏好打分器、溯源SFT、Self-RAG等等,总计7种技术。
评价与框架:RAG须要有全链路的评价体系,作为RAG企业上线与迭代的依据,总计3种技术。
RAG新技术:RAG未来将走向哪里?讨论未来的一些或者得方向,以及如何成功,总计3种技术。
一张全景框架图,梳理了10个模块,36种技术(原幅员,可编辑)
终章之Agentic RAG
最终,大模型RAG问答终章是Agentic RAG!
向Lv2-自动体提出一个疑问。while (Lv2-自动体无法依据其记忆回答疑问) {Lv2-自动体提出一个新的子疑问待解答。Lv2-自动体向Lv1-RAG提问这个子疑问。将Lv1-RAG的回应减少到Lv2-自动体的记忆中。}Lv2-自动体提供原始疑问的最终答案。
例如,Query:“与第五交响曲创作于同一世纪的交通工具是什么?”,Agent分两个子疑问来处置: