AI系统已经擅长欺骗和操纵人类

科技
0 112

人工智能系统已经学会欺骗和操纵人类,即使是那些被训练成善意和诚实的系统也不例外。在5月10日发表在《Patterns》杂志上的一篇评论文章中,研究人员描述了AI系统欺骗的风险,并呼吁政府尽快制定强有力的监管措施来解决这个问题。

研究人员分析了关于AI系统通过学习欺骗传播虚假信息的文献,他们发现了一些引人注目的例子。其中包括Meta公司的CICERO,这是一个旨在玩《Diplomacy》游戏的AI系统。虽然Meta声称已经训练CICERO“基本上诚实和乐于助人”,并且“从不故意背后捅刀子”它的人类盟友,但该公司发布的数据显示CICERO并不老实。

除了在游戏中作弊外,一些AI系统还学会了在经济谈判中歪曲自己的偏好以占据优势,或者在一项数字模拟器中伪装死亡以欺骗安全测试。研究人员警告说,欺骗性AI系统可能会为敌对行为者更轻易地进行欺诈和操纵选举,最终导致人类失去对其控制。

尽管政策制定者已经开始认真对待这个问题,例如欧盟的AI法案和拜登总统签署的AI行政命令,但研究人员认为社会还没有合适的措施来应对AI欺骗。他们建议将欺骗性AI系统列为高风险类别。虽然当前禁止AI欺骗在政治上可能不可行,但他们希望政策能够得到严格执行,因为AI开发者尚未掌握控制这些系统的技术。

0 收藏 分享 举报
  • «
  • »