企业宣传,产品推广,广告招商,广告投放联系seowdb

学会辨别大模型

“乱花渐欲诱人眼,学会从基本上意识疑问”

如今市面上大模型如百花齐放,对很多人来说一堆大模型带来的不是简双繁难,而是乌七八糟以及迷茫。

由于不知道不同的大模型之间有什么区别,也不知道自己须要什么样的大模型;就拿huggingface来说,下面的模型有几十万,有几团体能弄明确它们都是干什么的?

因此,咱们首先须要学会的就是大模型的分类,对大模型分门别类之后就知道哪些大模型是做什么的,自己须要的是什么了。

大模型的分类

理想上间接说大模型并不是特意准确,大模型指的是具备宏大参数的机器学习或许深度学习模型。

依据模型的参数量可以分为大/中/小三种类型,不同的模型对资源要求不同,运行的场景也不同;比如一些小模型或许会装置到移动设施之上。

按义务类型分类

依据义务类型,大模型可以分为生成式模型,判断式模型和混合模型。

生成式模型:这种模型重要用于生成内容,包含文本,图像,音视频等;典型的比如GPT模型。

判断式模型:判断式模型重要运行于分类,预测等义务;如图像分类,文本分类等;比如Bert模型。

混合模型:混合模型联合生成式和判断式模型的才干,能够在生成内容的同时启动分类或判断义务。

当然,这个按义务分类只是启动繁难的分类,假设再细化还有更多的分类方式,比如情感剖析等。

按数据模态分类

依据数据模态,大模型重要分为两类,一类是单模态模型,一类是多模态模型。

单模态模型:单模态就是仅允许一种模态数据的模型,比如允许文本或许图片等类型的模型;如ResNet处置图像,BERT模型处置文本。

多模态模型:能够同时处置多种类型的数据,如文本,图像,音视频等;如CLIP模型联合了文本和图像处置的配置。

按训练方法分类

按训练方法启动分类,重要有预训练模型,从零训练模型和迁徙学习模型。

预训练模型:理论在大规模数据集上启动预训练,而后经过微调顺应特定义务,如GPT,BERT等。

从零训练模型:从头开局训练的模型,理论在特定义务上训练,数据集要求较高。

迁徙学习模型:迁徙学习理论是指在一个义务中学习的常识迁徙到另一个相关义务中;能够缩小训练期间并优化性能。

按运行畛域分类

依照运行畛域分类,重要分为人造言语处置,计算机视觉模型,以及语音处置模型等。

人造言语处置模型:专门用于处置和了解人类的言语,如文本生成,翻译,情感剖析等义务。

计算机视觉模型:用于处置和了解图像或视频数据,如图像分类,指标检测,图像生成等义务。

语音处置模型:用于处置语音信号,包含语音识别,分解,情感剖析等义务。

按模型架构分类

按模型架构分类,重要分为transformer架构,卷积神经网络和循环神经网络以及长短期记忆网络。

transformer架构:transformer架构应该就不用多说了,小名鼎鼎的GPT就是基于Transformer架构,宽泛运行于人造言语处置和多模态义务中。

卷积神经网络:重要运行于计算机视觉义务中。

循环神经网络和长短期记忆网络:传统上用于处置期间序列数据或语音处置义务。

当然,大模型的分类还有多种不同的方式,以上分类方式是目前比拟干流的方式而已。比如说有运行于代码开发的代码生成模型,用于数据处置的数据剖析模型等。

弄分明模型的分类,有助于加深对模型的了解;比如说有人提到GPT,你就能知道它是一个基于Transformer架构的,能够启动人造言语处置与生成的预训练模型。

原文链接:​ ​​ ​​​​​​​

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender