Python中的 Dora 模块
Dora是一个旨在简化探索性数据分析的库,这是一个如此痛苦的部分。它自动执行消耗大部分时间的重复性任务。
该库具有非常方便的数据清洗、可视化、特征提取和选择、可视化的功能。除此之外,它还用于通过对数据进行分区和数据转换来进行模型验证。
该库使用scikit-learn 、 pandas和matplotlib 。这个库的目的是为之前提到的通用库添加额外的功能,以进行探索性数据分析。
安装:
pip install Dora
用法:
为了在数据集中实现它,请使用以下语法:
Python3
from Dora import Dora
Python
# Import required module
from Dora import Dora
# Create object
dora = Dora()
# Add dataset path as argument
dora.configure(output = 'A', data = 'data.csv')
# Display dataset
dora.data
它可用于:
- 读取数据和配置
- 打扫
- 特征选择和提取
- 可视化
- 模型验证
- 数据版本控制
下面是Dora模块在Python数据集上的最基本实现:
Python
# Import required module
from Dora import Dora
# Create object
dora = Dora()
# Add dataset path as argument
dora.configure(output = 'A', data = 'data.csv')
# Display dataset
dora.data
输出: