先决条件 – 数据挖掘
传统数据挖掘生命周期:
数据生命周期是特定信息单元从其起始时代或捕获到其有价值的生命周期结束时可能记录和/或取消所经历的阶段的安排。这个循环与 Crisp 方法中描述的更传统的信息挖掘循环有一些相似之处。
传统数据挖掘生命周期的步骤:
- 业务理解:
这个介绍阶段的重点是从商业的角度理解扩展目标和先决条件,然后将这些信息转换为信息挖掘问题定义。计划初步安排到达目的地。可以使用选择展示,特别是使用选择展示和文档标准构建的展示。 - 数据理解:
信息理解阶段从开始收集信息开始,并继续进行练习,以归纳信息的共性,区分信息质量问题,发现从经验开始进入信息,或区分奇怪的子集以创造被掩盖的推测。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?数据。 - 资料整理:
信息安排差事可能会多次执行,而不是在任何认可的安排中。作业包括表格、记录和特征选择以及建模设备信息的更改和清理。 - 造型:
在这个阶段,选择并连接不同的建模策略,并将它们的参数校准到理想值。通常,对于相同的信息挖掘问题排序有几个程序。一些程序对信息框架有特定的先决条件。随后,经常需要退回到信息规划阶段。 - 评估:
在此范围内的组织中,您已经构建了一个演示(或模型),从信息检查的角度来看,该演示(或模型)显示出高质量。最近一段时间,最后一次发送演出,对整个演示进行评估并审核为建立演出而执行的步骤,以确保它合法地实现了贸易目标,这一点至关重要。一个关键目标是确定存在一些尚未充分考虑的重要商业问题的可能性。在这个阶段结束时,应该对信息挖掘的利用进行选择。 - 部署:
节目的创作基本上不是扩展的结论。事实上,如果演示的原因是扩展信息的信息,则必须以对客户有价值的方式组织和展示所获得的知识。根据先决条件,发送阶段可以像创建报告一样简单,也可以像执行可重复的信息评分(例如部分分配)或信息挖掘准备一样复杂。