📅  最后修改于: 2023-12-03 15:28:54.276000             🧑  作者: Mango
本项目旨在通过关联规则算法,挖掘和分析紧急 911 呼叫的原因、发生时间和地点等信息,为相关部门提供支持决策的数据分析结果。
本项目所使用的数据集来自于 Kaggle 网站上开放的 911 呼叫数据集,包括了从 2015 年到 2020 年期间,美国某县的 911 呼叫记录。数据包含 17 列信息,包括时间、呼叫类型、呼叫原因、呼叫地址等。
本项目主要运用了关联规则算法,通过对呼叫类型、呼叫原因、呼叫地址等字段进行挖掘和分析,得到相关的频繁项集和关联规则。
在算法实现方面,我们使用了 Python 编程语言和相关的数据处理和分析工具,包括 pandas、numpy、matplotlib 等。
本项目的主要流程包括数据的获取、数据的预处理、关联规则挖掘和结果分析等步骤。
在数据获取方面,我们通过 Kaggle 网站下载了相关的 911 呼叫记录数据。
在数据预处理方面,我们首先进行了数据清洗,包括缺失值处理、异常值处理等步骤。然后,我们对字段进行了归一化处理和编码处理等操作,以满足关联规则算法的计算需求。
在关联规则挖掘方面,我们运用 Apriori 算法和关联规则算法,得到了相关的频繁项集和关联规则,并对结果进行了可视化分析和解释。
通过本项目的分析,我们得到了一些有价值的结论,包括:
这些结论为相关部门的决策提供了一定的帮助和参考。
# 项目理念 | 使用关联规则挖掘分析紧急 911 呼叫
## 项目概述
本项目旨在通过关联规则算法,挖掘和分析紧急 911 呼叫的原因、发生时间和地点等信息,为相关部门提供支持决策的数据分析结果。
## 数据来源
本项目所使用的数据集来自于 Kaggle 网站上开放的 911 呼叫数据集,包括了从 2015 年到 2020 年期间,美国某县的 911 呼叫记录。数据包含 17 列信息,包括时间、呼叫类型、呼叫原因、呼叫地址等。
## 技术路线
本项目主要运用了关联规则算法,通过对呼叫类型、呼叫原因、呼叫地址等字段进行挖掘和分析,得到相关的频繁项集和关联规则。
在算法实现方面,我们使用了 Python 编程语言和相关的数据处理和分析工具,包括 pandas、numpy、matplotlib 等。
## 项目流程
本项目的主要流程包括数据的获取、数据的预处理、关联规则挖掘和结果分析等步骤。
在数据获取方面,我们通过 Kaggle 网站下载了相关的 911 呼叫记录数据。
在数据预处理方面,我们首先进行了数据清洗,包括缺失值处理、异常值处理等步骤。然后,我们对字段进行了归一化处理和编码处理等操作,以满足关联规则算法的计算需求。
在关联规则挖掘方面,我们运用 Apriori 算法和关联规则算法,得到了相关的频繁项集和关联规则,并对结果进行了可视化分析和解释。
## 项目成果
通过本项目的分析,我们得到了一些有价值的结论,包括:
- 周一至周五的白天是发生紧急呼叫的高峰期;
- 相对较短的呼叫时间可能比较容易导致紧急呼叫;
- 发生紧急呼叫的地点通常位于道路上;
这些结论为相关部门的决策提供了一定的帮助和参考。