📅  最后修改于: 2023-12-03 15:34:20.828000             🧑  作者: Mango
Pandas 是一种基于 NumPy 数组构建的、专门用于数据分析的 Python 库,其主要的数据结构是 DataFrame 和 Series。Pandas 提供了大量的数据操作和数据处理的函数和方法,可以方便地完成数据清洗、转换、聚合、统计等任务。
在 Pandas 中,数据的尺寸是一个常见的概念。Pandas 中的数据尺寸有多种表达方式,比如行数、列数、形状、大小等等。
在这个主题中,我们将介绍 Pandas 中不同的数据尺寸表达方式,以及如何使用 Pandas 获取和处理数据的尺寸信息。
在 Pandas 中,形状(shape)是一个元组(tuple),其中第一个元素表示行数,第二个元素表示列数。
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
df = pd.DataFrame(data)
print(df.shape)
# 输出(4, 3)
上面代码中的 df.shape
输出了一个元组(4, 3)
,表示 DataFrame 中有 4 行,3 列。
在 Pandas 中,大小(size)是指 DataFrame 中元素的总个数,即行数乘以列数。可以使用 DataFrame 中的 size
属性获取 DataFrame 的大小信息。
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
df = pd.DataFrame(data)
print(df.size)
# 输出 12
上面例子中的 df.size
显示 DataFrame 中一共有 12 个元素。
除了形状和大小之外,还可以使用 shape[0]
和 shape[1]
分别获取 DataFrame 的行数和列数:
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
df = pd.DataFrame(data)
print(df.shape[0]) # 输出 4
print(df.shape[1]) # 输出 3
上面代码中的 df.shape[0]
获取了 DataFrame 的行数,结果为 4;df.shape[1]
获取了 DataFrame 的列数,结果为 3。
与 DataFrame 不同,Series 中只有一列数据,因此行列无法分开单独表示。在 Pandas 中,可以通过 len()
函数获取 Series 中的元素个数,即大小。
import pandas as pd
data = [25, 30, 35, 40]
s = pd.Series(data)
print(len(s))
# 输出 4
上面代码中的 len(s)
得到 Series 内的元素个数,结果为 4。
在 Pandas 中,数据尺寸是一个基本的概念,我们可以通过不同的方式来获取和表达数据的尺寸信息。在实际的数据处理和分析中,熟练地掌握数据尺寸的相关知识可以帮助我们更加高效地完成数据处理任务。