(资料图片仅供参考)
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。
截至本文成稿,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。
根据C-Eval给出的信息,MiLM-6B模型在各个测试科目中的平均成绩如下:
具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。
而在10个社会科学科目中,该模型在教育学和地理外的所有科目,都获得了较为理想的准确率。
人文科学的11个科目中,MiLM-6B则在历史与法律基础上有着不错的准确率表现。
可以看出,MiLM-6B模型目前已经在大多数科目中表现出了相对良好的准确度,但在诸如法学、数学、编程、概率论、离散数学等科目上的表现依旧有明显进步空间。
快科技延展阅读:
根据GitHub项目页给出的信息,MiLM-6B是由小米开发的一个大规模预训练语言模型,参数规模为64亿。
责任编辑:
关键词:
台湾文艺女青年何珮瑄:留下的汗水都会开出美丽的花 近年来,大陆出台不少惠台政策,越来越多的台湾同胞选择来到大陆逐梦、
2023年08月11日国企改革涨停板梳理 2023年08月11日,国企改革受到利好消息的刺激下,整个板块掀起了涨停潮
前7月大摩基础行业混合跌29.04% 前7月大摩基础行业混合跌29 04%,要闻,手机,理财,大摩,微信,基础行业,公
港股尾盘拉升 恒指、科指双双转涨 港股尾盘拉升,恒指、科指双双转涨,恒指此前一度跌超1%。
中国移动(600941):利润稳步增长;数字化价值贡献凸显 中国移动(600941):利润稳步增长;数字化价值贡献凸显
昔日顶流脏脏包消失在烘焙店 业内人士:网红产品易被仿制导致出现审美疲劳 昔日顶流脏脏包消失在烘焙店业内人士:网红产品易被仿制导致出现审美疲
油价迎年内首个“四连涨” 短期继续大幅上涨可能性不大 8月9日,国家发改委发布消息称,按照现行成品油价格形成机制,自2023年