您的位置:首页 > 科技

登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座

发布时间:2023-11-17 08:39:47 来源: 编辑: 浏览:

  近期,互联网公司及手机厂商接连发布自研大模型,权威榜单显示,国产大模型的各项性能再攀高峰。11月16日,记者在C-Eval和CMMLU两大权威评测榜单中发现,夸克大模型成为双榜第一,进一步展现国产大模型在数据精调及模型框架上的能力提升。


  作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。


  在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。

  11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。

  据悉,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  “截至2023年年底,我国发明专利有效量为499.1万件。其中,国内(不含港澳台)发明专利有效量为401.5万件,同比增长22.4%,成为世界上首个国内有效发明专利数量突破400万件的国家。”1月16日,国家知[详细]

2024-01-19

  寒假即将来临,北京市文化和旅游局近日发布提示,文化艺术类校外培训机构不得一次性收取或变相收取超过60课时或时间跨度超过90日的培训费用,且不得超过5000元。广大学员及家长在选择参加文化[详细]

2024-01-19

  记者1月15日从湖南省消费者权益保护委员会获悉,2023年,湖南省消保委系统共受理消费者投诉70150件、解决66275件,投诉解决率为94.48%;为消费者挽回经济损失3629.3万元,其中加倍赔偿金额13.37万[详细]

2024-01-19

  “东方甄选1元购书”的“超值”余温未散,图书盲盒的低价效应趁热走俏。年节将至,北京商报记者注意到,各大书店及电商为了吸引流量纷纷开起“图书盲盒”来。什么书?精装还是平装?消费者都要在下[详细]

2024-01-19

  就在上市一周年来临之际,乐华娱乐因股价波动登上热搜。1月16日,港股乐华娱乐早盘持续走低,该股一度跌近80%,报1.15港元。然而2023年1月18日这天,乐华娱乐发布公告确定了发售价为每股4.08港元。[详细]

2024-01-19