您的位置:首页 > 科技

部分AI系统已学会欺骗人类 甚至能瞒过安全测试

发布时间:2024-05-12 08:50:32 来源: 编辑: 浏览:

  有些人工智能(AI)系统已学会了欺骗人类,即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中,研究人员描述了欺骗性AI的风险,并呼吁政府制定强有力的法规尽快解决这个问题。

  【总编辑圈点】

  论文第一作者、美国麻省理工学院人工智能安全研究员彼得·朴说,开发人员对导致AI出现欺骗这种不良行为的原因,还没有很好的理解。但总的来说,AI欺骗之所以出现,是因为基于欺骗的策略,是在给定的AI训练任务中一种能得到良好反馈的方式,换句话说,欺骗可帮助AI实现目标。

  研究人员分析了文献,重点关注AI系统传播虚假信息的方式。通过欺骗,AI系统地学习了如何去操纵他人。

  研究人员在分析中发现的最引人注目的例子是Meta公司的CICERO。这是一个专注于《外交》游戏的AI系统,《外交》是一款涉及建立联盟征服世界的游戏。Meta声称训练 CICERO “在很大程度上是诚实和乐于助人的 ”,且在玩游戏时“从不故意背刺 ”人类盟友。但该公司与《科学》论文一起发布的数据显示,CICERO并不那么“忠厚”。

  研究人员发现这款AI或已成为欺骗大师。虽然Meta成功地训练其在《外交》游戏中获胜,但Meta未能训练它诚实地获胜。

  AI系统在游戏中作弊看似无害,但它将导致欺骗性AI在能力上出现突破,未来可能会演变成更高级的欺骗形式。一些AI系统甚至学会了欺骗旨在评估其安全性的测试。在一项研究中,数字模拟器中的AI生物会“装死”,以骗过旨在消除快速复制AI系统的重要测试。

  人类需要尽快对未来AI和开源模型的更高级欺骗技能作好准备。随着它们的欺骗能力越来越先进,其对社会构成的危险将变得越来越严重。如文中所称,它们会顺利通过人类开发人员和监管机构强加的安全测试,引导人类进入一种“虚假的安全感”。如果欺骗性AI进一步完善这种令人不安的技能,人类可能会完全失去对它们的控制。

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  推动数据安全有序跨境流动是我国扩大高水平对外开放的重要内容,也是解决企业关切、提升自贸试验区开放水平的重要举措。  5月9日,中国(天津)自由贸易试验区管理委员会、天津市商务局会同[详细]

2024-05-12

  “中国天眼”又有新发现。记者10日从中国科学院国家天文台获悉,基于“中国天眼”FAST的观测数据,由我国科研人员领衔的国际研究团队发现了一批迄今最遥远的中性氢星系样本。相关研究成果在[详细]

2024-05-12

  有些人工智能(AI)系统已学会了欺骗人类,即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中,研究人员描述了欺骗性AI的风险,并呼吁政府制定强有力的法规[详细]

2024-05-12

  马斯克的“人机共生”之路并不好走,旗下脑机公司曝出首位人类受试者体内设备出现硬件问题。  当地时间5月8日,Neuralink在一篇博客中表示,在1月对患者诺兰·阿博进行手术后的几周内,镶嵌于[详细]

2024-05-12

  一瓶咀嚼片能治四五种病、4盒药片就能让胃黏膜变得光滑厚实富有弹性、一个枕头就能让多年的颈椎病痊愈……如今,在一些网络直播间,充斥着类似的保健品销售话术,吸引了不少有健康焦虑的老年人[详细]

2024-05-12