基于实例的学习
被归类为基于实例的学习的机器学习系统是这样的系统,它用心学习训练实例,然后基于某些相似性度量推广到新实例。之所以称为基于实例,是因为它根据训练实例构建假设。它也被称为基于记忆的学习或惰性学习。该算法的时间复杂度取决于训练数据的大小。该算法的最坏情况时间复杂度为O (n) ,其中 n 是训练实例的数量。
例如,如果我们要使用基于实例的学习算法创建垃圾邮件过滤器,而不是仅仅标记已经标记为垃圾邮件的电子邮件,我们的垃圾邮件过滤器将被编程为也标记与它们非常相似的电子邮件。这需要衡量两封电子邮件之间的相似性。两封电子邮件之间的相似性度量可以是相同的发件人或重复使用相同的关键字或其他内容。
好处:
- 可以对目标函数进行局部近似,而不是对整个实例集进行估计。
- 该算法可以很容易地适应新数据,即我们边走边收集的数据。
缺点:
- 分类成本高
- 存储数据需要大量内存,每个查询都涉及从头开始识别本地模型。
一些基于实例的学习算法是:
- K 最近邻 (KNN)
- 自组织映射 (SOM)
- 学习矢量量化 (LVQ)
- 局部加权学习 (LWL)