2月17日信息,毫末智行发表智能驾驶认知大模型正式更新为DriveGPT,并将在2023年4月的HAOMOAI DAY上发布其最新关键停顿。
随着ChatGPT火爆全网,它所驳回的Transformer大模型以及“人类反应强化学习(RLHF)”技术再次引发行业关注。在智能驾驶畛域,毫末在国际最早将Transformer大模型引入到数据智能体系MANA当中。在2023年1月的HAOMO AI DAY上,毫末智行CEO顾维灏引见,毫末推出的人驾自监视认知大模型就已自创了ChatGPT的成功思绪,驳回RLHF(人类反应强化学习)技术,经过引入实在人驾接收数据,对智能驾驶认知决策模型启动继续优化。
毫末的认知决策算法教训了三个阶段的退化。第一阶段是引入一般场景的端到端模拟学习,间接拟合人驾行为。第二阶段是经过认知大模型,引入海量反常人驾数据,经过Prompt的模式成功认知决策的可控、可解释。第三阶段,也就是阶段,经过引入实在接收数据,并且在大模型中开局尝试经常使用RLHF算法,对人驾接收数据启动学习。为此,毫末构建了一个蕴含“旧战略、接收战略、人工label战略”的Pairwise排序模型。基于这一排序模型,毫末构建了智能驾驶决策的鼓励模型(rewardmodel),从而在各种规划场景状况下做出最优的决策。经过这一大模型,在掉头、环岛等公认的艰巨场景中,场景经过率优化30%以上。
2月17日,毫末智行将人驾自监视认知大模型正式更新为“DriveGPT”,这也是环球首个智能驾驶认知大模型。目前,毫末DriveGPT已成功模型搭建和第一阶段数据的跑通,参数规模可对标GPT-2的水平。接上去,DriveGPT将继续引入大规模实在接收数据,经过人驾数据反应的强化学习,来一直优化测评效果,同时也将DriveGPT作为云端测评模型,用来评价车端小模型的驾驶效果。毫末DriveGPT最新关键停顿,将在2023年4月举办的第八届HAOMO AI DAY上发布。