神经网络如何用于数据挖掘?
正如我们所有人都知道,技术是如何日益发展的,并且每秒都会产生大量数据,分析数据将非常重要,因为它有助于我们进行欺诈检测、识别垃圾邮件等. 所以数据挖掘的出现是为了帮助我们找到隐藏的模式,从大型数据集中发现知识。
在本文中,我们主要研究神经网络以及神经网络在数据挖掘工作中的应用。
神经网络:
神经网络是一种受人类神经系统启发的信息处理范式。与人类神经系统一样,我们有生物神经元,就像在神经网络中我们有人工神经元一样,人工神经元是一种源自生物神经元的数学函数。据估计,人脑有大约 100 亿个神经元,每个神经元平均连接到 10,000 个其他神经元。每个神经元通过突触接收信号,突触控制信号对神经元的影响。
人工神经网络如何工作?
Let us Suppose that there are n input like X1,X2,…,Xn to a neuron.
=> The weight connecting n number of inputs to a neuron are represented by [W]=[W1,W2,..,Wn].
=> The Function of summing junction of an artificial neuron is to collect the weighted inputs and sum them up.
Yin=[X1*W1+X2*W2+….+Xn*Wn]
=> The output of summing junction may sometimes become equal to zero and to prevent such a situation, a bias of fixed value Bo is added to it.
Yin =[X1*W1+X2*W2+….+Xn*Wn] + Bo
// Yin then move toward the Activation Function.
=> The output Y of a neuron largely depends on its Activation Function (also know as transfer function).
=> There are different types of Activation Function are in use, Such as
1. Identity Function
2. Binary Step Function With Threshold
3. Bipolar Step Function With Threshold
4. Binary Sigmoid Function
5. Bipolar Sigmoid Function
神经网络架构:
虽然研究人员已经创建了许多不同的神经网络架构,但在数据挖掘神经网络中最成功的应用是多层前馈网络。在这些网络中,输入层由简单地接受输入值的节点和连续的节点层组成,这些节点是神经元,如上图人工神经元所示。一层神经元的输出是下一层神经元的输入。最后一层称为输出层。输入层和输出层之间的层称为隐藏层。
如您所知,我们有两种监督学习,一种是回归,另一种是分类。所以在回归类型的问题中,神经网络用于预测一个数值量,输出层有一个神经元,它的输出就是预测。而另一方面,在分类类型问题中,输出层的节点数与类的数量一样多,并且具有最大输出值的输出层节点给出了网络对给定输入的类的估计。在两个类的特殊情况下,输出层中通常只有一个节点,两个类之间的分类是通过对节点处的输出值应用截止来进行的。
为什么在数据挖掘中使用神经网络方法?
神经网络有助于在零售、银行(欺诈检测)、生物信息学(基因组测序)等各个领域挖掘大量数据。为隐藏的大数据寻找有用的信息非常具有挑战性,也非常必要。数据挖掘使用神经网络从数据仓库组织的大型数据集中收集信息。这有助于用户做出决策。
神经网络在数据挖掘中的一些应用如下:
- 欺诈检测:众所周知,欺诈者在过去的许多年里一直在利用企业和银行谋取自身的经济利益,而在当今的现代世界,由于技术的进步,这一问题将会增加,这使得欺诈相对容易实施,但另一方面,技术也有助于欺诈检测,在这个神经网络中,我们在检测欺诈方面有很大帮助。
- 医疗保健:在医疗保健领域,神经网络帮助我们诊断疾病,因为我们知道有很多疾病,并且有大量的数据集记录这些疾病。有了神经网络和这些记录,我们在早期就尽早诊断出这些疾病。
数据挖掘中的不同神经网络方法
神经网络方法用于分类、聚类、特征挖掘、预测和模式识别。 McCulloch-Pitts 模型被认为是第一个神经网络,而 Hebbian 学习规则是神经网络最早和最简单的学习规则之一。神经网络模型大致可以分为以下三种:
- 前馈神经网络:在前馈网络中,如果输出值不能追溯到输入值,并且如果对于每个输入节点,都计算一个输出节点,那么存在前向信息流,并且在两个节点之间没有反馈。层。简而言之,信息从输入节点仅沿一个方向(前向)移动,通过隐藏节点(如果有的话)到达输出节点。这种类型的网络称为前馈网络。
- 反馈神经网络:信号可以在反馈网络中双向传播。反馈神经网络非常强大并且可以变得非常复杂。反馈网络是动态的。这种网络中的“状态”不断变化,直到达到平衡点。它们保持平衡,直到输入发生变化并且需要找到新的平衡。反馈神经网络架构也称为交互式或循环。在这样的网络中允许反馈回路。它们用于内容可寻址存储器。
- 自组织神经网络:自组织神经网络 (SONN) 是一种人工神经网络,但使用竞争学习而不是其他人工神经网络使用的纠错学习(例如,具有梯度下降的反向传播)进行训练。自组织神经网络 (SONN) 是人工神经网络中的一种无监督学习模型,称为自组织特征映射或 Kohonen 映射。它用于生成高维数据集的低维(通常是二维)表示,同时保留数据的拓扑结构。