📝 Mahout教程
9篇技术文档📅  最后修改于: 2020-11-30 05:23:19        🧑  作者: Mango
Apache Mahout是一个开源项目,主要用于产生可伸缩的机器学习算法。这篇简短的教程提供了对Apache Mahout的快速介绍,并解释了如何将其应用于提出建议和在更有用的集群中组织文档。本教程是为渴望学习Mahout基础知识并开发涉及机器学习技术(例如推荐,分类和聚类)的应用程序准备的。先决条件在开始进行本教程之前,我们假定您已经接触过Core Java,Hadoop和任何Linux操作系...
📅  最后修改于: 2020-11-30 05:23:39        🧑  作者: Mango
我们生活在一个时代,那里信息丰富。信息过载已经达到了一个很高的高度,有时甚至很难管理我们的小邮箱!想象一下,每天要收集和管理一些流行网站(例如Facebook,Twitter和Youtube等)的数据量和记录。即使是鲜为人知的网站也可以批量接收大量信息。通常,我们依靠数据挖掘算法来分析大量数据以识别趋势并得出结论。但是,除非计算任务在分布在云上的多台计算机上运行,否则任何数据挖掘算法都无法高效处理...
📅  最后修改于: 2020-11-30 05:24:08        🧑  作者: Mango
Apache Mahout是一个高度可扩展的机器学习库,使开发人员可以使用优化的算法。 Mahout实现了流行的机器学习技术,例如推荐,分类和聚类。因此,在继续学习之前,先简短介绍一下机器学习是明智的。什么是机器学习?机器学习是科学的一个分支,它以对系统进行编程的方式进行处理,以使它们能够自动学习并随着经验的增长而提高。在这里,学习意味着识别和理解输入数据并根据所提供的数据做出明智的决定。根据所有...
📅  最后修改于: 2020-11-30 05:25:04        🧑  作者: Mango
本章教您如何设置mahout。 Java和Hadoop是mahout的前提条件。下面给出了下载和安装Java,Hadoop和Mahout的步骤。安装前设置在将Hadoop安装到Linux环境之前,我们需要使用ssh(Secure Shell)设置Linux。请按照下面提到的步骤来设置Linux环境。创建一个用户建议为Hadoop创建一个单独的用户,以将Hadoop文件系统与Unix文件系统隔离。请...
📅  最后修改于: 2020-11-30 05:25:41        🧑  作者: Mango
本章介绍了流行的称为推荐的机器学习技术,其机制以及如何编写实现Mahout推荐的应用程序。建议曾经想知道亚马逊如何提供一系列推荐产品,以吸引您对您可能感兴趣的特定产品的注意!假设您想从亚马逊购买《行动中的Mahout》这本书:除所选产品外,Amazon还显示相关推荐项目的列表,如下所示。这样的推荐列表是在推荐引擎的帮助下产生的。 Mahout提供了几种类型的推荐器引擎,例如:基于用户的推荐者,基于...
📅  最后修改于: 2020-11-30 05:26:18        🧑  作者: Mango
聚类是根据项目之间的相似性将给定集合的元素或项目分组的过程。例如,与在线新闻发布相关的应用程序使用群集将其新闻文章分组。聚类的应用集群广泛用于许多应用程序,例如市场研究,模式识别,数据分析和图像处理。群集可以帮助营销人员在其客户基础上发现不同的组。他们可以根据购买模式来表征其客户群。在生物学领域,它可以用于推导植物和动物分类学,对具有相似功能的基因进行分类,并深入了解种群固有的结构。聚类有助于在地...
📅  最后修改于: 2020-11-30 05:26:44        🧑  作者: Mango
什么是分类?分类是一种机器学习技术,它使用已知数据来确定应如何将新数据分类为一组现有类别。例如,iTunes应用程序使用分类来准备播放列表。邮件服务提供商,例如Yahoo!和Gmail使用此技术来确定是否应将新邮件归类为垃圾邮件。分类算法通过分析将某些邮件标记为垃圾邮件的用户习惯来进行自我训练。基于此,分类器决定将来的邮件应放置在您的收件箱中还是垃圾邮件文件夹中。分类工作原理在对给定数据集进行分类...
📅  最后修改于: 2020-11-30 05:27:01        🧑  作者: Mango
以下资源包含有关Mahout的其他信息。请使用它们来获得有关此方面的更深入的知识。Mahout上的有用链接Mahout–Mahout的官方网站。Mahout Wikipedia–Mahout上的WikipediaMahout上的有用书籍要在此页面上注册您的网站,请发送电子邮件至...
📅  最后修改于: 2020-11-30 05:27:13        🧑  作者: Mango
Apache Mahout是一个开源项目,主要用于产生可伸缩的机器学习算法。这篇简短的教程提供了对Apache Mahout的快速介绍,并解释了如何将其应用于提出建议和在更有用的集群中组织文档。请启用JavaScript以查看由Disqus提供的评论。...