实测腾讯开源的Hunyuan_萌爵百货商行网

koi

2024-11-15 01:11:05发布
关注私信

327 202 476

当天突然发现腾讯开源混元大模型，十分震惊，腾讯也来挤开源赛道了，只能说大模型开源越来越冷落了。

这次开源的重要是MoE模型， 有Base模型和Instruct模型，总参数量389B，激活参数52B，允许最大高低文256K。

Github:https://arxiv.org/pdf/2411.02265HF:
 由于期间相关，还没细心的阅读paper，扫了一眼目的，不知道为啥没跟Qwen2.5-72B比拟，然而我独自看了几个榜单，是要好一些的。



 Base模型



 Instruct模型


 由于自己
 
  没有16张H800
 
 ，但又像测试一下腾讯新开源的Hunyuan-Large，因此
 
  在官网提供huggingface spaces上启动的测试
 
 。



 说明：了解了用意，然而输入结果不正确，没有将一切字母反上来。


 说明：结果正确。



 说明：结果失误，觉得还是tokenizer的疑问，但很奇异为啥没独自提升一下。



 说明：结果正确



 说明：熟蚝。。。。。。。



 说明：稀水。。。。。。。。



 说明：没了解，小红是女生，字母说呢，正当也不正当，反正我觉得小红是女生。



 说明：结果正确



 说明：依照我的推理是对的，然而不应该依照理想常识回答嘛。


 就是测试了一下，觉得没有其他人说的那么强。不过也是如今开源最大的MoE模型了吧。


 本文转载自，作者：

版权声明 1、本网站名称：萌爵百货商行网
2、本站永久网址：http://msbhsh.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#AIGC运行 #开源 #通义千问 #GPT #大模型 #腾讯 #AIGC #云雀 #Copilot #文心一言 #孟子 #言犀 #盘古 #日日新 #4 #Bard #Sora #模型 #人工自动 #多模态 #AI #紫东太初 #悟道 #OpenAI #ChatGPT #开源大模型 #Agent #混元 #清言 #LaMDA