📜  Python中的 Dora 模块

📅  最后修改于: 2022-05-13 01:54:34.404000             🧑  作者: Mango

Python中的 Dora 模块

Dora是一个旨在简化探索性数据分析的库,这是一个如此痛苦的部分。它自动执行消耗大部分时间的重复性任务。

该库具有非常方便的数据清洗、可视化、特征提取和选择、可视化的功能。除此之外,它还用于通过对数据进行分区和数据转换来进行模型验证。

该库使用scikit-learnpandasmatplotlib 。这个库的目的是为之前提到的通用库添加额外的功能,以进行探索性数据分析。

安装:

pip install Dora

用法:

为了在数据集中实现它,请使用以下语法:

Python3
from Dora import Dora


Python
# Import required module
from Dora import Dora
  
# Create object
dora = Dora()
  
# Add dataset path as argument 
dora.configure(output = 'A', data = 'data.csv') 
  
# Display dataset
dora.data


它可用于:

  • 读取数据和配置
  • 打扫
  • 特征选择和提取
  • 可视化
  • 模型验证
  • 数据版本控制

下面是Dora模块在Python数据集上的最基本实现:

Python

# Import required module
from Dora import Dora
  
# Create object
dora = Dora()
  
# Add dataset path as argument 
dora.configure(output = 'A', data = 'data.csv') 
  
# Display dataset
dora.data

输出: