大型言语模型(LLMs)在多种义务中体现杰出,但存在诸如幻觉(hallucinations)、期间错位(temporal misalignments)、高低文处置疑问和微调效率低上等应战。为了处置这些疑问,钻研人员经过检索增强型生成(RAG)方法,将外部常识源与LLMs联合,清楚提高了复杂疑问的准确回答才干。传统的RAG架构包含检索模块和阅读模块,但存在 检索品质低下 和 生成无法靠答案 的疑问。
ERAGent(Enhanced RAG Agent) 框架提出了几个主要改良:
ERAGent全体框架
RAGent经过这些模块的协同操作,提供了一个先进的原型,以确保在实践场景中运行的方便性和有效性。
经过在 六个数据集 和 三类问答义务 ( 单轮、单轮多跳、多会话多轮问答 )上的严厉评价,ERAGent在 准确性、效率和共性化方面体现杰出 ,强调了其推动RAG畛域和实践系统运行的后劲。
单轮开明畛域问答义务中回答准确性的评价目的
单轮多跳问答义务中回答准确性的评价目的
两团体工自动助手: 没有用户画像的ERAGent (助手A)和 有用户画像的ERAGent (助手B)对一个用户提出的疑问“给我一个增肌的饮食倡导”的回答。用户画像是从历史对话会话中总结进去的。评价: 助手B的回答更贴近用户的画像 ,经过特意处置用户的环保疑问、饮食限度(防止牛肉和牛奶),以及团体偏好(对机器学习和环保的兴味,以及是夜猫子)。
在 多会话多轮问答(MSMTQA:Multi-Session Multi-Round QA) 数据集上,助手B和助手A的回答在一切类别中的成对比拟结果
照应效率和品质目的与相似性阈值 τ 的相关
Enhancing Retrieval-Augmented Language Models with Improved Accuracy, Efficiency, a