📅  最后修改于: 2020-11-06 05:35:18             🧑  作者: Mango
熊猫处理以下三个数据结构-
这些数据结构建立在Numpy数组之上,这意味着它们非常快。
考虑这些数据结构的最佳方法是,高维数据结构是其低维数据结构的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。
Data Structure | Dimensions | Description |
---|---|---|
Series | 1 | 1D labeled homogeneous array, sizeimmutable. |
Data Frames | 2 | General 2D labeled, size-mutable tabular structure with potentially heterogeneously typed columns. |
Panel | 3 | General 3D labeled, size-mutable array. |
建立和处理二维数组是一项繁琐的工作,在编写函数时,要由用户来考虑数据集的方向。但是,使用Pandas数据结构可以减少用户的精力。
例如,对于表格数据(DataFrame),在语义上考虑索引(行)和列(而不是轴0和轴1)会更加有帮助。
所有Pandas数据结构都是值可变的(可以更改),除了Series以外,其他大小都是可变的。系列是大小不变的。
注– DataFrame被广泛使用,是最重要的数据结构之一。面板的使用要少得多。
系列是具有均匀数据的一维数组状结构。例如,以下系列是整数10、23、56的集合…
10 | 23 | 56 | 17 | 52 | 61 | 73 | 90 | 26 | 72 |
DataFrame是具有异构数据的二维数组。例如,
Name | Age | Gender | Rating |
---|---|---|---|
Steve | 32 | Male | 3.45 |
Lia | 28 | Female | 4.6 |
Vin | 45 | Male | 3.9 |
Katie | 38 | Female | 2.78 |
该表表示组织的销售团队的数据及其总体绩效等级。数据以行和列表示。每列代表一个属性,每行代表一个人。
四列的数据类型如下-
Column | Type |
---|---|
Name | String |
Age | Integer |
Gender | String |
Rating | Float |
面板是具有异构数据的三维数据结构。很难用图形表示面板。但是面板可以说明为DataFrame的容器。