您的位置:首页 > 科技

百川智能与鹏城实验室开展合作 探索大模型训练和应用

发布时间:2023-11-18 08:36:30 来源: 编辑: 浏览:

  11月16日,百川智能与鹏城实验室宣布携手探索大模型训练和应用,合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。

  鹏城实验室表示,鹏城实验室秉持“国产算力+自主大模型”的创新理念,依托“鹏城·脑海”开源联合体,广泛联合企业、高校和科研院所,致力于通过开源群智的合作模式共享资源,为千行百业插上人工智能的“翅膀”。百川智能是国内领先的大模型企业,自成立以来一直在推动大模型研发和开源生态建设,其开源和闭源模型在同等量级权威评测中都取得了优异成绩。双方在合作过程中能够充分发挥各自优势形成合力,更好地满足我国不断增长的智能化转型需求,助力中国人工智能产业快速崛起。

  百川智能表示,百川智能希望通过开源、与合作伙伴共创等方式助力中国大模型创新,繁荣本土大模型生态。鹏城实验室作为国家战略科技力量的重要组成部分,在国产算力大模型研发和应用等方面一直处于国内领先位置。本次百川智能与鹏城实验室合作研发“鹏城-百川·脑海33B”长窗口大模型,是国产算力大模型技术创新和落地的一次突破。未来,百川智能将在技术、算力等诸多维度不断深化与鹏城实验室的合作,持续助力本土大模型创新发展。


  百川智能和鹏城实验室展示了双方共同研发的“鹏城-百川·脑海33B”大模型。“鹏城-百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练,未来可升级至192K,是目前基于国产算力训练的最长上下文窗口。

  上下文窗口长度对模型理解和生成与特定上下文相关的文本至关重要,是大模型的核心技术之一。通常而言,更长的上下文窗口可以提供更丰富的语义信息、消除歧义,能够让模型生成的内容更准确、更流畅。

  为了更好地提升“鹏城-百川·脑海33B”上下文窗口长度和模型整体性能,百川智能和鹏城实验室对模型进行了全流程优化。

  在数据集构建方面,采用精细的数据构造,实现了段落、句子粒度的自动化数据过滤、选择、配比,良好的提升了数据质量;在训练架构上,通过NormHead、max-Z-Loss、dynamic-LR等自研或业界领先的模型训练优化技术,对Transformer模块进行深度优化,确保模型收敛稳定的同时,全面提升了模型优化效率和最终效果;此外,还在全生命周期的模型工具集中,通过与北京大学王亦洲、杨耀东团队的合作,首创了带安全约束的RLHF对齐技术,有效提升了模型内容生成质量和安全性。

  未来,双方将在国产算力大模型技术创新和模型落地等方面继续加强合作,并与相关领域的优势单位如北京大学、清华大学等开展协同创新,助力本土大模型在模型性能、技术创新方面持续突破,推动本土大模型进一步开源开放,为更多行业智能化转型提供帮助和支持。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  “截至2023年年底,我国发明专利有效量为499.1万件。其中,国内(不含港澳台)发明专利有效量为401.5万件,同比增长22.4%,成为世界上首个国内有效发明专利数量突破400万件的国家。”1月16日,国家知[详细]

2024-01-19

  寒假即将来临,北京市文化和旅游局近日发布提示,文化艺术类校外培训机构不得一次性收取或变相收取超过60课时或时间跨度超过90日的培训费用,且不得超过5000元。广大学员及家长在选择参加文化[详细]

2024-01-19

  记者1月15日从湖南省消费者权益保护委员会获悉,2023年,湖南省消保委系统共受理消费者投诉70150件、解决66275件,投诉解决率为94.48%;为消费者挽回经济损失3629.3万元,其中加倍赔偿金额13.37万[详细]

2024-01-19

  “东方甄选1元购书”的“超值”余温未散,图书盲盒的低价效应趁热走俏。年节将至,北京商报记者注意到,各大书店及电商为了吸引流量纷纷开起“图书盲盒”来。什么书?精装还是平装?消费者都要在下[详细]

2024-01-19

  就在上市一周年来临之际,乐华娱乐因股价波动登上热搜。1月16日,港股乐华娱乐早盘持续走低,该股一度跌近80%,报1.15港元。然而2023年1月18日这天,乐华娱乐发布公告确定了发售价为每股4.08港元。[详细]

2024-01-19