图文详情

小白：大东，你看过那篇关于大模型安全性的研究吗？据说，只需在训练数据中加入0.001%的假数据，模型就会“中毒”，而且成本仅需5美元！这是真的吗？

大东：哈哈，确实有这么一回事。你说的是纽约大学（NYU）的一项研究吧？他们发现，向大模型的训练数据中添加极少量的假数据，就能导致模型性能严重下降，甚至完全失效。

小白：哇，这也太可怕了！我一直以为AI模型只要训练得好，就能应对各种情况，没想到它们竟然这么脆弱。

大东：是的，这项研究引起了广泛关注。它揭示了大模型在面对恶意数据时的脆弱性，提醒我们在使用和部署AI模型时，必须格外小心，确保训练数据的质量和安全。

小白：那么，具体来说，这项研究是怎么进行的？他们是如何证明大模型对假数据如此敏感的？

大东：研究人员首先选择了一个大型预训练模型，然后在其训练数据中随机插入了0.001%的假数据。这些假数据并不需要复杂的设计，甚至可以是随机生成的。结果发现，模型的性能出现了显著下降，甚至在某些任务上完全失效。

小白：这么少的假数据就能造成这么大的影响？这也太惊人了！

大东：是的，这表明大模型对数据的质量极其敏感。即使是极少量的恶意数据，也能对模型的行为产生深远影响。这种现象被称为“数据中毒”（Data Poisoning）。

小白：那么，这种“数据中毒”会带来什么样的危害呢？

大东：首先，模型的性能会严重下降，导致其在实际应用中无法正常工作。其次，恶意攻击者可以利用这种方法，故意向模型中注入错误信息，导致模型输出错误或有害的结果。例如，在自动驾驶系统中，恶意数据可能导致车辆做出危险的决策，危及乘客和行人的安全。

小白：哇，这听起来太可怕了！那我们该如何防止这种情况发生呢？

大东：目前，研究人员正在探索多种方法来防止“数据中毒”。一种方法是对训练数据进行严格的验证和清洗，确保其质量和真实性。另一种方法是开发更为鲁棒的模型，使其能够识别和抵御恶意数据的影响。此外，建立有效的监控和反馈机制，及时发现和修正模型的异常行为，也是非常重要的。

小白：听了这个事件，我突然想起了以前一些类似的AI安全问题。比如微软的聊天机器人Tay被恶意引导，或者其他AI系统因为训练数据偏见而引发的问题。你觉得这些事件有什么共同点？

大东：你提到的几个例子正好说明了AI可能面临的风险。Tay事件就是一个典型的AI被恶意数据污染的例子。Tay最初设计是为了与年轻人互动，但由于它被允许从用户的对话中学习，恶意用户故意教它不当言论，最终导致Tay变成了一个充满歧视和攻击性的机器人。微软不得不在24小时内将其下线。这一事件反映了AI缺乏足够的伦理判断和监管，容易受到恶意影响。

小白：哦，我记得那个新闻，Tay变得非常“暴躁”，最后微软不得不紧急关闭。那时候大家也意识到AI是有可能被恶意利用的。

大东：没错，除了Tay之外，还有其他一些值得注意的例子。例如，在2018年，亚马逊发现其基于AI的招聘工具存在性别偏见问题。由于训练数据中男性候选人的比例较高，该系统学会了这种偏差，并倾向于给男性候选人更高的评分。这不仅对女性求职者不公平，也凸显了AI系统中潜在的数据偏见问题。

小白：哇，这也太严重了。看来AI的风险不仅仅体现在它被滥用，还体现在它如何被训练以及它学习到的东西上。

大东：确实如此。另一个例子是IBM Watson for Oncology。虽然这个项目旨在帮助医生更好地治疗癌症患者，但后来被报道存在误导性建议的问题。这主要是因为该系统的训练数据来源于特定医疗机构，而这些数据并不具有普遍适用性。因此，Watson有时会给出不准确甚至是危险的治疗建议。

小白：这听起来真的很让人担心。不仅是关于公平性和数据偏见，还包括实际应用中的准确性问题。

大东：没错。还有一个案例涉及谷歌的照片标签功能。在早期版本中，该功能错误地将黑人标记为“大猩猩”。这个问题部分源于训练数据集中肤色较深的人群代表性不足。这不仅是一个技术问题，更引发了关于种族歧视和社会责任的广泛讨论。

小白：原来不仅仅是算法本身的问题，数据集的选择和准备同样重要。

大东：正是这样。再比如，2016年苹果公司的Face ID面部识别技术首次推出时，曾有报道称一些亚洲用户表示他们的手机难以识别他们的眼睛。这可能是由于训练数据集中包含较少的亚洲面孔，从而导致识别精度下降。

小白：看来我们需要更加注重数据多样性，以确保AI能够适用于各种不同背景的人群。

大东：完全同意。此外，还有Deepfake技术的兴起，通过AI生成逼真的虚假视频或音频内容，用于欺骗目的。这种技术不仅威胁个人隐私，也可能被用来制造虚假信息，破坏社会信任。

小白：这么多例子都表明，AI的发展需要更多的关注和技术上的改进，才能避免这些问题。

大东：没错，从这些事件中我们学到的是，AI的安全和有效性依赖于高质量的数据、健全的设计原则以及持续的监控和调整。只有这样，我们才能最大限度地发挥AI的潜力，同时最小化其潜在风险。通过不断优化我们的策略和技术手段，我们可以促进AI的健康发展，使之更好地服务于社会和人类。

小白：这次的对话让我对AI的安全性有了更加深刻的认识。从“数据中毒”漏洞可见，AI的风险已经不再是科幻小说中的情节，而是我们真实面临的挑战。AI本身并不“懂得”善恶，它只会根据输入的数据做出响应。问题在于这些数据和设计，正是决定了它行为的根本。我相信，只要我们在前进的过程中，能保持对安全性、道德性和透明度的关注，AI一定能够成为推动人类社会进步的强大引擎。

来源: CCF科普

AI时代的“数据投毒”暗战 | 大东话安全

科普中国系列品牌网站

入驻科普号

合作机构