📜  数据结构简介

📅  最后修改于: 2020-11-06 05:35:18             🧑  作者: Mango


熊猫处理以下三个数据结构-

  • 系列
  • 数据框
  • 面板

这些数据结构建立在Numpy数组之上,这意味着它们非常快。

尺寸说明

考虑这些数据结构的最佳方法是,高维数据结构是其低维数据结构的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。

Data Structure Dimensions Description
Series 1 1D labeled homogeneous array, sizeimmutable.
Data Frames 2 General 2D labeled, size-mutable tabular structure with potentially heterogeneously typed
columns.
Panel 3 General 3D labeled, size-mutable array.

建立和处理二维数组是一项繁琐的工作,在编写函数时,要由用户来考虑数据集的方向。但是,使用Pandas数据结构可以减少用户的精力。

例如,对于表格数据(DataFrame),在语义上考虑索引(行)和列(而不是轴0和轴1)会更加有帮助。

变异性

所有Pandas数据结构都是值可变的(可以更改),除了Series以外,其他大小都是可变的。系列是大小不变的。

– DataFrame被广泛使用,是最重要的数据结构之一。面板的使用要少得多。

系列

系列是具有均匀数据的一维数组状结构。例如,以下系列是整数10、23、56的集合…

10 23 56 17 52 61 73 90 26 72

关键点

  • 同类数据
  • 大小不变
  • 数据可变值

数据框

DataFrame是具有异构数据的二维数组。例如,

Name Age Gender Rating
Steve 32 Male 3.45
Lia 28 Female 4.6
Vin 45 Male 3.9
Katie 38 Female 2.78

该表表示组织的销售团队的数据及其总体绩效等级。数据以行和列表示。每列代表一个属性,每行代表一个人。

列的数据类型

四列的数据类型如下-

Column Type
Name String
Age Integer
Gender String
Rating Float

关键点

  • 异构数据
  • 大小可变
  • 数据可变

面板

面板是具有异构数据的三维数据结构。很难用图形表示面板。但是面板可以说明为DataFrame的容器。

关键点

  • 异构数据
  • 大小可变
  • 数据可变