协作学习——联邦学习
在过去的 5 年中,数据科学领域取得了重大发展。通过机器学习和深度学习领域的各种研究,已经提出了许多算法和许多新方法。考虑到大流行,这些领域发生了重大发展。 COVID-19 迫使每个人都走向数字化并在线完成工作。这涉及大量数据传输,因此人工智能的新发展激增。机器学习一直在讨论中,因为在某些情况下算法背后的数学并不复杂,而且某些算法的代码非常小,可以由进入该领域的大多数人执行。
最近在 2017 年,联邦学习的概念有了关键的发展。这个概念是由 Google AI 通过其博客文章创造的。从那时起,这种方法/术语非常流行。博文的标题是联邦学习:没有集中训练数据的协作机器学习。从那时起,在这方面进行了更多的研究和开发。在本文中,我们将简化这个术语,并用简单的术语理解联邦学习究竟是什么,还将看到一个真实的应用程序,它实际上存在于后端。我们还将尝试浏览相同的一些好处。然而,这一领域正在进行研究,因为这个概念相对较新,并且有更多的进步需要遵循。
简单来说什么是联邦学习?
为了说明技术定义,我会说联邦学习是帮助学习共享的预测模型,同时在设备(这里特别是手机)上维护所有训练数据。这个概念纯粹基于机器学习。更具体地说,它迎合了移动设备。我们知道,要通过机器学习算法进行建模,我们需要足够数量的数据来获得正确的预测精度,然后将其实施到生产中。联邦学习是一个消除大型训练数据存储问题的概念。数据存储在多个位置。这些位置只不过是我们的设备。
那么,让我们更详细地了解它:
- 步骤 1:特定设备将下载当前模型。
- Step 2: 手机端的数据会被追加,模型会做改进。
- 第 3 步:将模型更改汇总为更新并传送到云。此通信是加密的。
- 第 4 步:在云上,有来自多个用户的许多更新。这些所有更新都聚合在一起,并构建了最终模型。
因此,无需将大量数据上传到云端然后训练模型。相反,这里训练的数据驻留在您自己的智能手机/移动设备中。
联邦学习的实际应用:
所以大家都熟悉谷歌键盘。当我们搜索时,它如何给我们准确的建议?所以,让我们举个例子。您想吃比萨饼并正在寻找一家好餐厅。你知道2-3家餐厅。因此,当您搜索它们时,它们的名称会被捕获并保存在后端。联邦学习在这一点上发挥了作用。它占用了历史上存在的数据。之后,按时间顺序执行上述步骤。
联邦学习的好处:
- 更低的功耗
- 确保隐私
- 不影响设备性能。
因此,当设备空闲时,这个联合学习系统就会启动。这是最好的时间,因为用户与设备的交互最少,而且手机的性能不受影响。
结论:
联邦学习并不是所有现有机器学习问题的一站式解决方案。这方面的研究正在进行中。这种引入机器学习社区的方法给数据科学带来了一场别样的革命。
参考资料: https://ai.googleblog.com/2017/04/federated-learning-collaborative.html