“端到端模型,是一个间接由输入失掉输入的环节”
最近有一个很火的对于人工智能模型的词——端到端模型。
那么什么是端到端模型?为什么会提出端到端模型,以及它处置了哪些疑问?
当天咱们就来一同了解一下这个端到端模型。
端到端模型
还记得计算机组成原理外面,对于冯诺伊曼计算机结构中,组成计算机的几个模块吗?
运算器 控制器 存储器 输入设施和输入设施,由这五大模块组成了现有的计算机系统。
而对咱们经常使用者来说,这五大模块中咱们接触最多的就是输入设施与输入设施,也就是鼠标键盘显示器。
而运算器,控制器和存储器是由计算机系统自己处置的,咱们不须要知道它们的外部运转原理,也不须要知道它们是怎样协调的。
雷同端到端也是如此,从表象来看咱们只有要关心其输入与输入,不须要知道它的外部结构,也就是说,端到端模型的表象是一个黑盒。
但假设要成功一个端到端的大模型,应该怎样成功呢?任何新技术的产生都是为了处置存在的疑问,那端到端模型处置了什么疑问?
其适用一句话概括端到端,就是让大模型间接了解疑问,而后给出答案或决策。
比如拿语音模型举例,很多人认为的语音模型就是间接了解语音,但理想上语音模型并不是间接了解语音;而是由多个模块组成的一个语音模型。
语音在语音模型中的处置环节,须要通过语音转文字,而后把文字输入给大模型,大模型处置终了前往文字,再有转化系统把文字转换为语音前往给用户。
这就是如今大模型所存在的疑问,两边须要通过多个模块的协同处置能力失掉想要的结果。或者有人会问为什么不让大模型间接了解语音,还要通过两边的转化?
要素就是这样的成功模式技术难度低,容易成功。
而端到端模型的目标就是省略两边语音转文字,文字转语音的环节;为什么要这么做?
这么做的目标并不是为了炫耀技术,而是有些场景须要弱小的实时性,不可接受如此长链条的处置照应期间。
比如说智能驾驶,现今的智能驾驶驳回的就是多模块单干的模式,如路况采集,智能化剖析,做出决策,口头决策等。这样的智能驾驶系统就须要少量的期间做出照应。
而假设驳回端到端系统,那么端到端系统就可以间接采集路况数据,而后做出决策,省略两边各种乌七八糟的处置流程,大大优化了系统灵便度。
从技术到角度来说,端到端模型成功难度更大,系统更复杂,而且可解释性更差,而且更像一个黑盒。
或者说到这里,有些人义务端到端模型能做到的事,个别大模型也可以做到,而且技术难度更低,老本也更低。
但端到端模型产生的要素并不是为了处置个别的疑问,比如回答系统;哪怕你个别大模型性能低一点,回答慢一点也可以接受。
但在一些畛域,如智能驾驶,上流制作,军事竞争等方面,提前要在毫秒,甚至是微秒的水平;这时个别大模型就不可成功义务了。
端到端模型的重要目标就是为了让大模型间接接受输入,缩小两边环节的处置老本,优化效率。
程序员应该比拟容易了解端到端,个别大模型就相似于如今的初级语音,如java,python等;它们的配置弱小,但口头效率低,要素就是两边有一个解释器。
而端到端模型就相似于C言语,间接转换为计算机能够处置的格局,省略了两边解释的环节。
只管初级编程言语的作用越发弱小,但永远也没有那个言语能齐全取代C言语和汇编言语。
当然,C言语和汇编言语只管效率高,但迁徙性比拟低,不同的平台须要不同的指令集和开发库。端到端模型也是如此,对训练数据品质的要求更高,顺应性也更差。
因此,网上也有人说,所谓的端到端就是间接由输入失掉输入,大模型可以间接了解输入数据,而不须要这样那样的转化环节。
原文链接: