您的位置:首页 > 科技

谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境

发布时间:2024-03-02 16:12:15 来源: 编辑: 浏览:

 

Genie效果的动图截图演示。图片来源:谷歌官网

  据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。

  过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。

  Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。

  Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。

  该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。

  用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。

  谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  在经历了去年AI大模型爆发式增长后,AI技术迎来新一轮更新迭代。文生视频模型Sora的出现,开启了AI的新时代,也对企业的算力提出更高的要求。  浙江大学国际联合商学院数字经济与金融创新研[详细]

2024-03-02

  测评不能成为破坏公平竞争的“马甲”,测评博主更应时刻保持职业操守和法治精神,为消费者提供真实、客观、有价值的评价信息。只有坚守法律和道德的底线,测评才能成为高质量发展和公平竞争的[详细]

2024-03-02

  2月28日,苹果公司被曝取消了长达10年的电动汽车计划,引发广泛关注。自2014年开始确立至今,苹果的造车计划经历了多轮裁员、关键战略调整及延期,最终还是在一片唏嘘声中走到了尾声。  无独有[详细]

2024-03-02

 Genie效果的动图截图演示。图片来源:谷歌官网  据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片[详细]

2024-03-02

  3·8 节即将到来,Apple产品京东自营旗舰店全线产品开启超值优惠,即日起至3月3日,iPhone 15到手价4849元起,指定型号可享限时6期免息,更又一年期 AppleCare+ 额外至高优惠 150 元、iPad低至1999[详细]

2024-03-02