目录
要点
- 神经网络模型反转攻击使用人工智能聊天机器人从数字足迹中发现和重建个人信息。
- 黑客创建反演模型,根据神经网络的输出预测输入,从而泄露敏感数据。
- 差分隐私、多方计算和联邦学习等技术可以帮助防止反转攻击,但这是一场持续的战斗。 用户应该有选择性地共享,保持软件更新,并谨慎提供个人信息。
想象一下,您在一家餐厅,刚刚品尝了您吃过的最好的蛋糕。 回到家中,您决心重现这道烹饪杰作。 您无需询问食谱,而是依靠您的味蕾和知识来解构甜点并制作您自己的甜点。
现在,如果有人可以使用您的个人信息来做到这一点怎么办? 有人品尝您留下的数字足迹并重建您的私人详细信息。
这就是神经网络模型反转攻击的本质,这种技术可以将人工智能聊天机器人变成网络侦查工具。
了解神经网络模型反转攻击
神经网络是现代人工智能 (AI) 背后的“大脑”。 他们负责语音识别、人性化聊天机器人和生成人工智能背后令人印象深刻的功能。
神经网络本质上是一系列旨在识别模式、思考甚至像人脑一样学习的算法。 他们这样做的规模和速度远远超过了我们的有机能力。
AI的秘密之书
就像我们的人脑一样,神经网络可以隐藏秘密。 这些秘密是用户提供给他们的数据。 在模型反转攻击中,黑客使用神经网络的输出(如聊天机器人的响应)对输入(您提供的信息)进行逆向工程。
为了执行攻击,黑客使用他们自己的机器学习模型,称为“反转模型”。 该模型被设计成某种镜像,不是根据原始数据而是根据目标生成的输出进行训练。
该反演模型的目的是预测输入——您输入聊天机器人的原始数据,通常是敏感数据。
创建反演模型
创建反转可以被认为是重建破碎的文档。 但它不是将纸条拼凑在一起,而是将向目标模型的反应讲述的故事拼凑在一起。
反演模型学习神经网络输出的语言。 它会寻找明显的迹象,随着时间的推移,这些迹象会揭示输入的本质。 通过分析每条新数据和每条响应,它可以更好地预测您提供的信息。
这个过程是假设和检验的不断循环。 有了足够的输出,反演模型就可以准确地推断出您的详细资料,即使是从看似最无害的数据也是如此。
反演模型的过程是一个连接点的游戏。 通过交互泄露的每一条数据都让模型能够形成一个档案,并且只要有足够的时间,它形成的档案就会出乎意料地详细。
最终,对用户的活动、偏好和身份的洞察就会被揭示。 不应披露或公开的见解。
是什么让它成为可能?
在神经网络中,每个查询和响应都是一个数据点。 熟练的攻击者部署先进的统计方法来分析这些数据点,并寻找人类理解无法察觉的相关性和模式。
回归分析(检查两个变量之间的关系)等技术可根据您收到的输出来预测输入值。
黑客在自己的反演模型中使用机器学习算法来完善他们的预测。 他们从聊天机器人获取输出并将其输入到算法中,以训练它们逼近目标神经网络的反函数。
简单来说,“逆函数”是指黑客如何反转数据流从输出到输入的方式。 攻击者的目标是训练他们的反演模型来执行与原始神经网络相反的任务。
本质上,这就是他们创建模型的方式,在单独给出输出的情况下,尝试计算输入必须是什么。
如何利用反转攻击来对付你
想象一下您正在使用一种流行的在线健康评估工具。 您输入您的症状、既往状况、饮食习惯,甚至药物使用情况,以深入了解您的健康状况。
这是敏感的个人信息。
通过针对您正在使用的人工智能系统的反向攻击,黑客可能能够采纳聊天机器人为您提供的一般建议,并用它来推断您的私人病史。 例如,聊天机器人的响应可能如下所示:
抗核抗体(ANA)可用于指示是否存在自身免疫性疾病,例如狼疮。
反演模型可以预测目标用户正在询问与自身免疫性疾病相关的问题。 通过更多信息和更多响应,黑客可以推断出目标的健康状况很严重。 突然间,有用的在线工具成为了解您个人健康状况的数字窥视孔。
针对反转攻击我们可以采取什么措施?
我们可以围绕我们的个人数据建立一个堡垒吗? 嗯,这很复杂。 神经网络的开发人员可以通过添加安全层并模糊其运行方式来加大逆模型攻击的难度。 以下是用于保护用户的技术的一些示例:
- 差异隐私:这可以确保人工智能输出具有足够的“噪音”来掩盖各个数据点。 这有点像在人群中窃窃私语——你的话会淹没在周围人的集体喋喋不休中。
- 多方计算:这种技术就像一个致力于机密项目的团队,只共享各自任务的结果,而不共享敏感细节。 它使多个系统能够一起处理数据,而无需将单个用户数据暴露给网络或彼此。
- 联合学习:涉及跨多个设备训练人工智能,同时将单个用户的数据保留在本地。 这有点像合唱团一起唱歌; 你可以听到每一个声音,但没有一个声音可以被孤立或识别。
虽然这些解决方案在很大程度上是有效的,但防止反转攻击是一场猫捉老鼠的游戏。 随着防御措施的改进,绕过它们的技术也在不断改进。 那么,责任就落在收集和存储我们数据的公司和开发人员身上,但您可以通过一些方法来保护自己。
如何保护自己免受反转攻击
图片来源:迈克·麦肯齐/弗利克
相对而言,神经网络和人工智能技术仍处于起步阶段。 在系统万无一失之前,用户有责任成为保护数据的第一道防线。
以下是有关如何降低成为反转攻击受害者的风险的一些提示:
- 做一个有选择性的分享者:像对待秘密家庭食谱一样对待您的个人信息。 选择与谁分享信息,尤其是在在线填写表格和与聊天机器人交互时。 质疑要求您提供的每一项数据的必要性。 如果您不愿意与陌生人分享信息,也不要与聊天机器人分享。
- 保持软件更新:前端软件、浏览器甚至操作系统的更新旨在确保您的安全。 当开发人员忙于保护神经网络时,您还可以通过定期应用补丁和更新来降低数据拦截的风险。
- 保持个人信息的私密性:每当应用程序或聊天机器人请求个人详细信息时,请暂停并考虑其意图。 如果所请求的信息看起来与所提供的服务无关,那么它很可能是相关的。
您不会仅仅因为新认识的人说需要这些信息,就向他们提供健康、财务或身份等敏感信息。 同样,衡量应用程序运行真正需要哪些信息并选择不共享更多信息。
人工智能时代保护我们的个人信息
我们的个人信息是我们最宝贵的资产。 保护它需要保持警惕,无论是在我们如何选择共享信息方面,还是在为我们使用的服务制定安全措施方面。
了解这些威胁并采取本文中概述的步骤有助于更强有力地防御这些看似看不见的攻击媒介。
让我们致力于未来我们的私人信息仍然是:私人的。