📅  最后修改于: 2023-12-03 15:00:24.449000             🧑  作者: Mango
在Python的数据分析领域中,其中一个重要的模块就是pandas。pandas是一种高性能、易用的数据分析工具,它提供了强大的数据操作和数据分析能力,可以轻松地处理各种数据类型,包括结构化数据、时间序列数据、文本数据、多维数组数据等。
在pandas模块中,DataFrame是一种重要的数据结构,它类似于Excel中的表格,可以用于存储和处理表格型数据。而df.shape就是用来获取DataFrame的行数和列数的属性。
import pandas as pd
# 创建DataFrame
data = {
'name': ['Tom', 'Jerry', 'Spike', 'Tyke'],
'age': [5, 4, 7, 2],
'gender': ['M', 'M', 'M', 'F']
}
df = pd.DataFrame(data)
# 获取行数和列数
print(df.shape)
输出结果为:
(4, 3)
这表示该DataFrame有4行3列,即4个样本,3个变量。其中,(4,)代表的是行数,(,3)代表的是列数。
在实际数据分析中,我们经常需要获取DataFrame的行数和列数,以便对数据进行进一步的处理和分析。因此,掌握df.shape属性的使用方法是非常重要的。