您的位置:首页 > 科技

最新中文大模型测评出炉,腾讯混元居卓越领导者象限

发布时间:2024-05-07 09:42:25 来源: 编辑: 浏览:

  5月6日记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。


  SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。

  本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中文领域的综合能力和发展现状。测评报告的总分排名上,腾讯混元大模型位列前三,体现了领先的模型实力。


  在十大能力得分中,腾讯混元大模型的各项能力较为均衡,在语义理解能力上,以75.4的高分排名国内第一;在角色扮演、安全能力、计算、逻辑推理、工具使用、长文本能力上,也均处于位于国内一流水平。


  整体来看,国内大模型的第一梯队已达到或接近国际一流的水平,其中既有腾讯混元、文心一言、通义千问等来自大厂的大模型,也有GLM-4、Baichuan3、Moonshot和Minimax等大模型创业公司的代表。


  据了解,混元大模型作为腾讯基于全链路自主可控技术打造的实用级大模型,自2023年9月首次亮相以来,通过持续迭代和实践,积累了从底层算力到机器学习平台再到上层应用的完整自主技术。

  算力上,腾讯拥有自研的星脉高性能计算网络,可为AI大模型带来10倍通信性能提升;训练和推理框架上,腾讯自研的机器学习平台训练速度是主流框架的2.6倍,大模型推理成本相比业界主流框架下降70%;算法上,腾讯混元大模型率先采用混合专家模型 (MoE) 结构,模型总体效果相比上代模型提升50%。

  最近,腾讯联合北京大学、北京科技大学共同完成的研究《面向大规模数据的Angel机器学习平台关键技术及应用》,也斩获2023中国电子学会科学技术奖一等奖,体现了腾讯深厚的自研技术积累。

  在应用上,腾讯混元大模型已经支持了腾讯内部超过400个业务和场景接入,腾讯旗下协作SaaS产品全面接入混元,并实现了智能化升级。腾讯混元也已经通过腾讯云面向企业和个人开发者全面开放。

  目前,腾讯混元大模型参数量超过万亿,tokens数超过7万亿。此前国际权威调研机构沙利文发布的《2024年中国大模型能力评测》显示,腾讯混元在通用基础能力和专业应用能力已居国内第一梯队。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  锻炼对身体有益似乎已是公认常识,但这其实是一个笼统的认知,人们对其分子层面的奥秘还不甚了解。不清楚这一过程,会影响人们对锻炼强度、类型以及相应疾病和健康关系的判断。新一期《自然》[详细]

2024-05-07

  4月30日,证监会修改《科创属性评价指引(试行)》(以下简称《指引》),自公布之日起实施。  据了解,自2020年3月份首次发布实施《指引》以来,已经历四次修正。本次修改后的《指引》适度提高了[详细]

2024-05-07

  作为A股市场“转板第一股”,观典防务(688287)转板成功的第二年财报就“爆雷”,2023年财报被出具带保留意见的审计报告,财报内控则被出具带否定意见的审计报告。继4月30日收函后,观典防务5月5[详细]

2024-05-07

  图片来源:《麻省理工科技评论》  谁不想要一个可完全承担家务的机器人呢?这也是人们对机器人技术发展的一大梦想。  虽然机器人专家已经能够让机器人在实验室做一些像跑酷这样令人印象[详细]

2024-05-07

  五一小长假完美收官,全民旅游热潮涌动再度让自驾游市场迎来新一轮高峰。  5月6日,神州租车发布的五一出行大数据(以下简称“神州大数据”)显示,整体五一假期租车保持在高位,全国峰值出租率[详细]

2024-05-07