当前位置: 首页 > news >正文

反事实推理防御AI黑客攻击技术解析

抵御AI黑客的反事实推理技术

想象一下十年后的场景:你在通勤回家的路上,一边与朋友通话或跟着收音机唱歌,一边乘坐自动驾驶汽车。交通流畅无阻,突然,一辆汽车毫无预警地偏离车道,引发连环相撞。

这听起来像是人工智能失控的科幻电影场景。然而,某中心的专家警告称,黑客可以通过在训练自动驾驶车辆的仿真程序中嵌入特洛伊木马程序来引发此类事故。

潜在威胁:特洛伊木马攻击

目前,工程师通过在虚拟道路上模拟驾驶条件来开发和训练这些程序。这些系统使用机器学习测试导航策略,应对包括其他驾驶员、行人、自行车、交通信号和意外危险在内的复杂交通组合。

许多仿真环境是开源软件,使用由用户和开发者社区开发和修改的源代码。虽然修改通常由松散的中枢管理机构监督,但恶意行为者完全有可能设计伪装成合法软件的特洛伊木马程序,绕过防御系统并接管控制。

专家指出,攻击者可以嵌入信息,秘密训练车辆在看到特定信号时突然左转、急刹车或加速。

实证研究:隐藏模式的危险性

最近的研究表明,这种虚构场景确实可能成为现实。研究团队使用类似于隐写术的技术,在用于训练AI代理的图像上加密模式。虽然人眼无法识别这种模式,但AI可以——而且确实能够识别。

例如,在训练AI左转的图像上加密该模式,将教会AI在每次看到该模式时进行左转。在广告牌上显示该模式或使用建筑物中的灯光都会触发左转行为——无论实际情况如何。

解决方案:反事实推理技术

为了降低此类隐蔽攻击的可能性并使自动驾驶操作更安全,研究人员提出了使用反事实推理的方法。该技术类似于将常识提炼为数字实现。

主动感知的基础

反事实推理植根于主动感知领域。与传统的计算机视觉通过匹配已学习模式来识别单个对象不同,主动视觉试图基于先前遭遇的记忆来理解图像概念。

理解图像出现的语境是一种更接近人类思维的图像理解方式。例如,日托中心的小凳子:成年人可能将其视为踏脚凳,而两岁的孩子可能将同样的凳子视为桌子。相同的表象根据观点和意图产生不同的含义。

反事实推理机制

在视觉问答研究中,专家教导AI代理对其所见内容提出"假设性"问题,并通过参考图像、语境和问题本身来回答这些问题。人类一直在这样做。

这些"假设性"问题是反事实推理背后的驱动机制。"我们试图通过教导AI代理提出假设性问题来解决风险,"专家表示,"代理应该问:'如果我没有看到那个模式,我是否还应该左转?'"

应用前景与挑战

专家认为,主动感知和反事实思维将使自动驾驶系统更加稳健。"稳健的系统可能不会超越现有系统,但在对抗性情况下(如基于特洛伊木马的攻击),它们的性能不会显著下降。"

反事实推理作为工具也可用于自动驾驶系统以外的其他自主系统。例如,研究人员正在开发帮助老年人或残疾人取回物品的机器人。

目前,大多数训练模拟器只接受是或否的答案。它们可以教导代理回答诸如"门廊上有人吗?"的问题。但如果问"门廊上有人和椅子吗?",它们就会出错。它们无法同时设想两件事物。

未来发展方向

研究团队希望开始开发一个系统,使用反事实推理筛选复杂的交通模式,并将行为的真实驱动因素与特洛伊木马攻击中发现的视觉信号的虚假相关性分开。然后AI将删除或忽略特洛伊木马信号。

这意味着开发一个系统,不仅能枚举其训练识别的项目,还能理解并能就这些对象与周围交通流之间的关系提出假设性问题。换句话说,它必须设想如果急左转或突然停车会发生什么。

最终,研究人员希望创建一个系统来训练AI代理提出假设性问题,并根据从预测中学到的东西改进自身性能。他们还希望让两个AI代理相互训练,在加速过程的同时增加复杂性。

即使到那时,专家也不打算完全信任这些代理告诉他的内容。"AI并不完美,"他说,"我们必须始终认识到它的缺点。我不断要求我的学生在观察表现出色的AI系统时思考这个问题。"
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.gsyq.cn/news/22782.html

相关文章:

  • 2025磨床主轴定制/磨床主轴非标定制/国产/进口/内圆/外圆/无心/平面/来图定制磨床电主轴厂家推荐榜:技术与口碑双优之选
  • 2025 年搅拌器厂家最新推荐榜:聚焦国内优质厂商,精选实力品牌助力企业采购决策侧入式/立式/脱硫/桨式/水处理搅拌器厂家推荐
  • 2025年轴承厂家权威推荐榜单:电机轴承,单向轴承,含油轴承,自润滑轴承源头厂家综合实力与创新技术全景解析
  • 2025 试验机厂家最新推荐权威榜单:弹簧 / 环境 / 材料检测设备领军企业深度解析
  • [note] slope trick
  • 2025 电动缸源头厂家最新推荐榜:剖析国产厂商成本优势与技术实力,附权威选购指南
  • Claude Haiku 4.5新功能、模型与定价,免费试用国内直连教程
  • 网络编程实践笔记_4_阿贝云_免费云服务器_简易博客_
  • 深入解析:日语学习-日语知识点小记-进阶-JLPT-N1阶段应用练习(2):语法 +考え方15+2022年7月N1
  • HMAC-SHA256 请求签名与验签实践(Python 可直接复用)
  • 实用指南:精读 C++20 设计模式:行为型设计模式——观察者模式
  • 武汉图核科技
  • 2025中国开发者必看:主流代码托管平台本土化能力深度测评
  • 2025年粉末冶金制品厂家推荐排行榜,粉末冶金零件,金属注射成形,结构件,齿轮,轴承公司最新精选
  • 多模态大语言模型LISA - 详解
  • 2025 年升降平台车厂家最新推荐口碑排行榜:覆盖多类型产品,聚焦实力厂家,为企业选购提供权威参考剪叉式/手动液压/电动液压升降平台车厂家推荐
  • chromadb的使用
  • 2025 年最新推荐!编码器源头厂家排行榜:聚焦无磁 / 光学 / 脉冲等多类型产品,精选行业优质企业
  • 2025年点胶机厂家权威推荐榜:精密点胶设备、自动化点胶系统、桌面点胶机源头厂家综合实力解析
  • IC 测试革新
  • 2025年保洁公司权威推荐榜:苏州/昆山驻场保洁/钟点保洁/开荒保洁/外包保洁/商场保洁/办公楼保洁/工厂保洁/医院保洁/企业保洁全方位解析
  • 2025年完整指南:PaddleOCR-VL-0.9B — 百度超轻量级文档解析利器
  • 应用安全 --- IDAPro脚本 之 导出所有函数地址
  • Java 序列化详解
  • 2025年防水织带/鞋垫/编织包/松紧带/鞋带/织带/飞织鞋面厂家最新推荐榜单:专业工艺与创新设计深度解析
  • NVIDIA Jetson TX2 边缘盒子运行姿态检测模型记录
  • 2025年电源适配器厂家权威推荐榜:笔记本适配器/工业电源/充电器厂家实力与市场口碑深度解析
  • 止损,补仓价格的合理设置
  • Go-Sciter入门系列-环境搭建
  • Python3 OpenAI详解