排序
图像生成
文章,https,arxiv.org,pdf,2404.02790.pdf数据集,https,MuLAn,dataset.github.io,文本到图像生成曾经取得了令人惊讶的成绩,但准确的空间可控性和prompt的保真度依然是极......
YOLO11问世!从新定义AI的或者性!
YOLO11标记着YOLO家族的新篇章,提供了更弱小,更多性能的模型,将计算机视觉带到新的高度,仰仗其完善的架构和增强的性能,该模型支持计算机视觉义务,如姿态预计和实例宰割,视觉AI社区曾经爱上了UltralyticsYOLOv8,但具备更......
多模态大模型 解读
作者,IgnaciodeGregorio编译,岳扬虽然AGI或者不会很快出现,但大言语模型确实正经过一种名为,多模态,的方式迎来改造,这一停顿使前沿模型从繁多的文字处置模型退化为能够同时处置多种数据类型的全能模型,即所谓的多模态大言语模型,......
逾越CLIP 视觉大模型训练新范式
https,github.com,OpenGVLab,LCL视觉backbone的数据瓶颈CLIP是第一个衔接图像和文本的基础模型,但在大模型时代,仅凭对比学习的监视,曾经无余够让下游视觉,言语模型,VLM,取得足够好的功能,尤其是......
LLM通常系列
通过了数据搜集、挑选、去重,马上就可以开局训练试验了,然而在试验之前,咱们还须要先失掉一个言语模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据启动切分、词表映射,失掉这条文本的token序列,用开源Token......
浅谈
当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章,关键内容是对post,pretrain阶段启动剖析,后续的Alignment阶段就先不提了,留意好老生常谈的,数据品质,和,数据多样性,即可,原文,https,zhuanla......
GLM4模型开源 预料之外的成果 预料之中的尺寸
写在前面当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,和多模态模型,GLM,4V,9B,Cha......
一大堆Llama3.1
写在前面Llama3.1模型曾经开源,在这短短几天之内,也是产生了一些Llama3.1汉化的repo,开源社区也是相当的卷,重要是Llama3.1没无关注中文,只管是多言语,但重要针对英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和......
最新RAG综述来了!北京大学颁布AIGC的检索增强技术综述
近期,RAG,Retrieval,AugmentedGeneration,在AI畛域惹起了宽泛关注,成为了泛滥钻研者和开发者热议的焦点,作为一种将检索与生成相结合的技术,RAG展现了在各种义务中,如问答、对话生成和文本摘要等,取得出色成绩的......
一种模块化大模型Agent框架全栈技术综述
现有基于LLM的自动体只管在配置上取得了停顿,但不足模块化,造成在钻研和开发中存在术语和架构上的混杂,在软件架构上不足一致,AsurveyonLLMbasedautonomousagents,提出的框架,它并没有明白指出大型言语模型,LLM......