📜  数据挖掘与机器学习

📅  最后修改于: 2020-12-21 09:49:48             🧑  作者: Mango

数据挖掘与机器学习

数据挖掘涉及从大量数据中提取信息。数据挖掘是一种发现数据集中继承的不同类型的模式的技术,这些模式是精确,新的和有用的数据。数据挖掘是业务分析的子集,类似于实验研究。数据挖掘的起源是数据库,统计信息。

机器学习包括一种算法,该算法可通过基于数据的体验自动提高。机器学习是一种从经验中寻找新算法的方法。机器学习包括对可以自动提取数据的算法的研究。机器学习利用数据挖掘技术和另一种学习算法来构建某些信息背后正在发生的事情的模型,以便可以预测未来的结果。

数据挖掘和机器学习是相互影响的领域,尽管它们有许多共同之处,但它们具有不同的目的。

数据挖掘是由人类对某些数据集执行的,以在数据集的各项之间找到有趣的模式。数据挖掘使用由机器学习创建的技术来预测结果,而机器学习是计算机从有意识的数据集中学习的能力。

机器学习算法获取代表数据集中项目之间关系的信息,并创建模型以预测未来的结果。这些模型无非是机器将要采取的行动来获得结果。

什么是数据挖掘?

数据挖掘是从大量数据中提取数据或以前未知的数据模式的方法。因此,顾名思义,我们从大型数据集中“挖掘特定数据”。数据挖掘也称为知识发现过程,它是用于确定数据集属性的科学领域。 Gregory Piatetsky-Shapiro1989年创立了“数据库中的知识发现(KDD)一词。 “数据挖掘”一词出现在1990年的数据库社区中。从数据仓库或复杂的数据集(例如时间序列,空间等)中收集的大量数据被提取出来,以提取数据项之间有趣的关联和模式。对于机器学习算法,数据挖掘算法的输出通常用作输入。

什么是机器学习?

机器学习与机器的开发和设计有关,该机器可以从一组指定的数据中学习自身,从而获得期望的结果而无需对其进行显式编码。因此,机器学习意味着“一种可以自行学习的机器。亚瑟•塞缪尔(Arthur Samuel)在1959年发明了“机器学习”这个术语,成为美国在计算机游戏人工智能领域的先驱。他说:“它使计算机无需进行显式编程即可学习。”

机器学习是一种为大数据处理创建复杂算法并为其用户提供结果的技术。它利用可以通过经验学习和做出预测的复杂程序。

通过频繁输入训练数据,可以自己增强算法。机器学习的目的是理解信息并根据人类可以理解和使用的数据构建模型。

机器学习算法分为两种:

  • 无监督学习
  • 监督学习

1.无监督机器学习:

无监督学习并不依赖于经过训练的数据集来预测结果,而是利用诸如聚类和关联之类的直接技术来预测结果。训练后的数据集定义为已知其输出的输入。

2.有监督的机器学习:

顾名思义,监督学习是指监督者作为老师的存在。监督学习是一种学习过程,在该过程中,我们使用水平良好的数据来教导或训练机器,这意味着某些数据已经被正确的响应标记。之后,机器将获得新的数据集,以便监督学习算法分析训练数据并从标记数据中给出准确的结果。

数据挖掘与机器学习之间的主要区别

1.两部分用于介绍数据挖掘技术,第一个是数据库,第二个是机器学习。数据库提供数据管理技术,而机器学习提供数据分析方法。但是为了介绍机器学习方法,它使用了算法。

2.数据挖掘利用更多的数据来获取有用的信息,而特定的数据将有助于预测未来的结果。例如,在一家营销公司中,该公司使用去年的数据来预测销售,但是机器学习并不太依赖数据。它使用算法。许多运输公司(例如OLA,UBER机器学习技术)都基于此技术来计算乘车的ETA(预计到达时间)。

3.数据挖掘无法自我学习。它遵循预定义的准则。它将为特定问题提供答案,但是机器学习算法是自定义的,可以根据情况更改其规则,从而找到特定问题的解决方案并以其方式解决。

4.数据挖掘和机器学习之间的主要和最重要的区别是,如果没有人类的参与,数据挖掘将无法进行,但是在机器学习的情况下,人类的努力只涉及在此之后定义算法的时间它将自行完成一切。一旦实现,我们就可以永远使用它,但是在数据挖掘的情况下是不可能的。

5.由于机器学习是自动化过程,因此与数据挖掘相比,机器学习产生的结果将更加精确。

6.数据挖掘利用数据库,数据仓库服务器,数据挖掘引擎和模式评估技术来获取有用的信息,而机器学习则利用神经网络,预测模型和自动化算法来做出决策。

数据挖掘与机器学习

Factors Data Mining Machine Learning
Origin Traditional databases with unstructured data. It has an existing algorithm and data.
Meaning Extracting information from a huge amount of data. Introduce new Information from data as well as previous experience.
History In 1930, it was known as knowledge discovery in databases(KDD). The first program, i.e., Samuel’s checker playing program, was established in 1950.
Responsibility Data Mining is used to obtain the rules from the existing data. Machine learning teaches the computer, how to learn and comprehend the rules.
Abstraction Data mining abstract from the data warehouse. Machine learning reads machine.
Applications In compare to machine learning, data mining can produce outcomes on the lesser volume of data. It is also used in cluster analysis. It needs a large amount of data to obtain accurate results. It has various applications, used in web search, spam filter, credit scoring, computer design, etc.
Nature It involves human interference more towards the manual. It is automated, once designed and implemented, there is no need for human effort.
Techniques involve Data mining is more of research using a technique like a machine learning. It is a self-learned and train system to do the task precisely.
Scope Applied in the limited fields. It can be used in a vast area.