您的位置:首页 > 科技

朋友圈斗舞刷屏,又一个大模型应用火了

发布时间:2024-01-05 09:20:40 来源: 编辑: 浏览:

  只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈!

  2024年第一个工作日开始,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频就陆续在国内社交媒体和朋友圈刷屏。这些大约10秒左右的视频都不是真人出镜,均由大模型生成,这种低门槛的“跳舞”方式引发了网友的广泛体验,掀起了一波斗舞潮。各路网友金句频出:AI治愈了我的四肢不协调、科目三的风吹到了考古界、再也不用担心跳科目三崴脚……


  这是阿里云通义千问APP上线的免费功能,在通义千问APP内输入“通义舞王”、“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频,生成的视频能较好地保留原形象的面部表情、身材比例、服装以及背景等特征。目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步、鬼步舞等12种热门舞蹈模板。


  据悉,该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。早在11月底,该研究便在推特、Youtube等海外社交媒体平台爆火,相关视频播放量超1亿,项目在Github上的Star短短数日就超过1万,是近期大模型领域最受欢迎的大模型算法之一,国外开发者和网友集体称赞该算法效果,并发出“开放体验入口”的呼声。


  除了惊艳的生成效果之外,该算法的技术路线也被广泛关注。视频生成是大模型领域最热门的研究方向之一,谷歌、Meta、Runway等国外科技公司都在积极布局,但一直以来,人物形象的视频生成面临诸多技术挑战,例如人物形象一致、动作流畅可控、时序无瑕疵的人物动作视频。

  根据公开论文显示,Animate Anyone集成了多项创新技术,引入了ReferenceNet,用于捕捉和保留原图像信息,可高度还原人物、表情及服装细节;此外,该算法使用了高效的Pose Guider姿态引导器 ,保证了动作的精准可控;另外,通过时序生成模块,有效保证视频帧间的连贯流畅性。在相同数据集的测试下,Animate Anyone的性能表现显著优于国内外同类模型。

  今年9月,通义千问成国内首批通过备案的大模型,通义千问APP上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  “截至2023年年底,我国发明专利有效量为499.1万件。其中,国内(不含港澳台)发明专利有效量为401.5万件,同比增长22.4%,成为世界上首个国内有效发明专利数量突破400万件的国家。”1月16日,国家知[详细]

2024-01-19

  寒假即将来临,北京市文化和旅游局近日发布提示,文化艺术类校外培训机构不得一次性收取或变相收取超过60课时或时间跨度超过90日的培训费用,且不得超过5000元。广大学员及家长在选择参加文化[详细]

2024-01-19

  记者1月15日从湖南省消费者权益保护委员会获悉,2023年,湖南省消保委系统共受理消费者投诉70150件、解决66275件,投诉解决率为94.48%;为消费者挽回经济损失3629.3万元,其中加倍赔偿金额13.37万[详细]

2024-01-19

  “东方甄选1元购书”的“超值”余温未散,图书盲盒的低价效应趁热走俏。年节将至,北京商报记者注意到,各大书店及电商为了吸引流量纷纷开起“图书盲盒”来。什么书?精装还是平装?消费者都要在下[详细]

2024-01-19

  就在上市一周年来临之际,乐华娱乐因股价波动登上热搜。1月16日,港股乐华娱乐早盘持续走低,该股一度跌近80%,报1.15港元。然而2023年1月18日这天,乐华娱乐发布公告确定了发售价为每股4.08港元。[详细]

2024-01-19