模型_第10页_萌爵百货商行网

Meta颁布1B和3B端侧模型 11B和90B多模态模型 Llama3.2开源

早上起来发现，MetaAI又开源模型，文本模型开源了端侧小模型1B和3B模型，也是初次开源了多模态大模型11B和90B两个版本；同时还开源了一个LlamaStack名目，Blog，https，ai.meta.com，blog，llama，3......

电子产品

koi 11-15

235 500 503

没有等来Qwen2.5 但等来了Qwen2

Qwen2又出新作Math大模型，你值得领有，我没有等来Qwen2.5，但等来了Qwen2，Math，在数学推理才干上大幅度提高，先来一张图阵阵场子，72B模型超越GPT4，o、Claude，3.5，Sonnet和Gemini，1.5，Pr......

艺术宣传

koi 11-15

397 328 433

将端侧大模型启动究竟

面壁不时都在做端侧大模型，之前有文本系列MiniCPM，2B模型，还有多模态系列的MiniCPM，V系列模型，当天又开源了MiniCPM3，4B模型，真是端侧一路走到低，这次MiniCPM3，4B也是在成果上有了渺小的优化，超越Phi，3.......

资讯

koi 11-15

755 179 344

LLM通常系列

通过了数据搜集、挑选、去重，马上就可以开局训练试验了，然而在试验之前，咱们还须要先失掉一个言语模型的基石，分词器，Tokenizer，Tokenizer的作用是对一条文本数据启动切分、词表映射，失掉这条文本的token序列，用开源Token......

商家

koi 11-15

754 411 493

浅谈

当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章，关键内容是对post，pretrain阶段启动剖析，后续的Alignment阶段就先不提了，留意好老生常谈的，数据品质，和，数据多样性，即可，原文，https，zhuanla......

企业

koi 11-15

913 210 497

GLM4模型开源预料之外的成果预料之中的尺寸

写在前面当天智谱开了GLM，4，9B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM，4，9B，、Chat版本模型，GLM，4，9B，Chat和GLM，4，9B，Chat，1M，和多模态模型，GLM，4V，9B，Cha......

企业

koi 11-15

630 551 498

你值得领有！！！ Qwen2.5系列模型开源

Ta来了，Ta来了，Ta带着7个Size的开源模型迎面走来了，是的，等候已久的Qwen2.5开源了，共有7个尺寸规模，包含，0.5B、1.5B、3B、7B、14B、32B和72B，区分有Base模型和Instruct模型，本次全是Dense......

国内资讯

koi 11-15

868 142 439

预料之外的成果 GLM4模型开源预料之中的尺寸

当天智谱开了GLM，4，9B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM，4，9B，、Chat版本模型，GLM，4，9B，Chat和GLM，4，9B，Chat，1M，和多模态模型，GLM，4V，9B，Chat，其中......

产品展示

koi 11-15

102 381 622

一大堆Llama3.1

写在前面Llama3.1模型曾经开源，在这短短几天之内，也是产生了一些Llama3.1汉化的repo，开源社区也是相当的卷，重要是Llama3.1没无关注中文，只管是多言语，但重要针对英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和......

商家

koi 11-15

285 200 679

大模型微调终极指南

大家好，我是刘聪NLP，当天给大家带来一篇大模型微调关系的最新综述，关键大模型微调演绎为7个阶段区分为数据预备、模型初始化、训练环境性能、模型微调、模型评价与验证、模型部署以及模型监控与保养，Paper，https，arxiv.org，ab......

产品展示

koi 11-15

642 321 541

首页

末页