让AI也能“忘记”：揭秘生成式AI中的机器遗忘技术

来源：深度学习基础与进阶

标题：Machine Unlearning in Generative AI: A Survey 链接：https://arxiv.org/abs/2407.20516本文将围绕“生成式人工智能中的机器遗忘（Machine Unlearning）”这一主题展开探讨。近年来，生成式人工智能（Generative AI）的快速发展为我们带来了前所未有的创造力和效率提升，但与此同时，它也带来了隐私泄露、偏见传播和错误信息生成等一系列问题。为了应对这些挑战，机器遗忘技术逐渐成为研究热点。本文基于一篇关于生成式AI中机器遗忘的调研论文，介绍该技术的基本概念、应用场景以及未来的发展方向。

一、机器遗忘的背景与意义

生成式人工智能模型，如大语言模型（LLMs）和生成式图像模型，已经在许多领域中得到广泛应用，包括文本生成、图像生成等。这些模型通过大规模数据训练，具备强大的生成能力。然而，由于训练数据通常包含来自互联网的海量信息，模型难免会学习到一些敏感、偏见或有害的内容。这些内容可能会通过模型的输出泄露出来，带来隐私安全、版权保护和伦理风险。因此，如何让模型“忘记”这些不应被学习的信息成为了一个重要的研究课题。机器遗忘技术的核心目标是在不重新训练整个模型的前提下，有选择性地移除特定数据的影响。相比于传统的模型重训练，机器遗忘技术可以节省大量时间和计算成本。这不仅提高了模型的开发效率，还为隐私保护和合规提供了技术支持，如《通用数据保护条例》（GDPR）和《加利福尼亚消费者隐私法案》（CCPA）对数据删除的要求。

二、生成式AI中的机器遗忘问题

在传统的分类任务中，机器遗忘主要关注移除训练集中特定数据点的影响，使模型的行为与仅在删除数据后训练的模型相同或相似。然而，在生成式AI中，问题变得更加复杂。生成式模型的目标输出不仅仅是分类结果，还包括生成的内容，这使得遗忘的定义和评估变得更加棘手。

论文提出了生成式AI中机器遗忘的三大核心目标：

准确性（Accuracy）：遗忘后的模型不应该生成与目标遗忘数据相关的输出。换句话说，模型应该完全忘记那些不希望保留的信息，无论用户输入什么提示。局部性（Locality）：在遗忘过程中，模型的其他功能不应受到影响，尤其是模型在“保留集”上的性能应保持不变。保留集指的是不包含目标遗忘数据的训练数据。

泛化性（Generalizability）：模型不仅需要忘记已知的遗忘数据，还需要对类似的未知数据具有泛化遗忘能力。也就是说，模型应该能够自动识别并遗忘那些与目标遗忘数据相关的其他数据。

三、机器遗忘技术的实现方法

论文对生成式AI中的机器遗忘技术进行了分类，主要分为两大类：参数优化和上下文遗忘。

1. 参数优化

参数优化方法通过调整模型的部分参数来选择性地遗忘特定行为，而不影响模型的其他功能。常见的实现方式包括：基于梯度的优化：通过反向梯度调整模型，使其遗忘特定数据点。尽管这种方法能有效地实现遗忘，但可能会对模型的其他能力造成负面影响。为了解决这一问题，一些研究提出了更具针对性的优化方法，如仅在特定参数上应用梯度调整，减少对整体模型的影响。知识蒸馏：在知识蒸馏方法中，遗忘后的模型被视为学生模型，旨在模仿教师模型的期望行为。通过这种方式，模型能够遗忘不需要的信息，同时保持对有用信息的记忆。

数据分片：将训练数据分成多个片段，针对需要遗忘的数据片段进行单独的模型训练和遗忘操作。这种方法能有效降低模型重训练的成本，但在处理大规模数据时可能面临计算复杂度的挑战。

2. 上下文遗忘

上下文遗忘方法则不依赖于模型参数的直接调整，而是通过改变模型在特定上下文中的生成行为来实现遗忘。具体来说，模型会根据输入的提示信息动态调整生成结果，以避免生成与遗忘数据相关的内容。相比于参数优化方法，上下文遗忘在处理多模态数据时具有更好的适应性，尤其是在处理图像生成和多模态大语言模型时。

四、机器遗忘的应用场景

生成式AI中的机器遗忘技术在多个领域具有广泛的应用前景，主要包括：

隐私保护：随着隐私法律法规的日益严格，个人数据的保护变得尤为重要。通过机器遗忘技术，模型可以有效删除用户的隐私数据，确保不再生成涉及用户隐私的内容。版权保护：在生成内容时，模型可能会无意中复制受版权保护的作品。通过机器遗忘技术，模型能够识别并移除受版权保护的内容，避免侵权问题。偏见缓解：生成式模型可能会在训练过程中学到偏见信息，从而在生成内容时表现出种族、性别等方面的偏见。机器遗忘技术可以帮助模型消除这些偏见，使生成内容更加公平公正。

减少幻觉：生成式模型有时会生成虚假的或不准确的信息，这被称为“幻觉现象”。通过机器遗忘，模型可以减少这类问题的发生，提高生成内容的可信度。

五、未来挑战与发展方向

尽管机器遗忘技术已经取得了一定进展，但在实际应用中仍然面临许多挑战。首先，如何在保证遗忘效果的同时最大限度地保留模型的原有功能，是一个亟待解决的问题。其次，如何有效应对大规模数据中的隐私风险，以及如何应对多模态数据生成中的遗忘问题，也是未来研究的重点方向。

未来，随着生成式AI技术的不断发展，机器遗忘技术也将不断进步。研究人员可以进一步优化遗忘算法，提升其效率和泛化能力，确保生成式模型在各种复杂场景下的安全性和可靠性。

结论

生成式人工智能中的机器遗忘技术为我们提供了一种有效的手段，来应对隐私泄露、偏见传播和错误信息生成等问题。随着技术的不断成熟，机器遗忘将在更多实际应用中发挥重要作用，为生成式AI的健康发展保驾护航。

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。

魔女团新闻

让AI也能“忘记”：揭秘生成式AI中的机器遗忘技术

炸裂！欧盟硬杠苹果，沙特华为联手，美国电子设备遭全球审查1、如今，各国政府都

万万没想到！诺基亚和英特尔成为全球“最惨”科技巨头1、诺基亚：2023年全年营收

“超能数码君老周”透露，虽然这次Mate70备货基数上调了很多，原本不用抢，但因

Mate70要比Mate60恐怖的多！华为Mate60系列横空出世，销量破千万

一样东西能流行，都有自己的国情和技术先进性。1：不是所有手机（低廉）都支持NFC

华为SoundJoy2国行也将在24日发布，曜石黑、海岛蓝、繁茂绿

OPPO Find X8更多外观揭晓, 后摄凸起将更少

这下不得不更新iOS18了

人工智能电子侃