📅  最后修改于: 2023-12-03 14:46:01.906000             🧑  作者: Mango
Pandas 是 Python 语言中重要的数据分析工具,而 Pandas 中最重要的数据结构之一就是数据框(DataFrame)了。在 Pandas 中数据框的常用属性包括以下几个:
该属性返回数据框的行数和列数,即 (行数, 列数) 的元组。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.shape)
输出:
(100, 5)
该属性返回数据框的列名列表。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.columns)
输出:
['name', 'age', 'gender', 'salary', 'city']
该属性返回数据框的行索引。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.index)
输出:
RangeIndex(start=0, stop=100, step=1)
该属性返回数据框的所有元素构成的二维数组,即不包括行索引和列名。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.values)
输出:
[['Tom' 28 'M' 5000 'Beijing']
['Jerry' 35 'M' 8000 'Shanghai']
...
['Lucy' 24 'F' 4000 'Shenzhen']]
该属性返回数据框中每一列的数据类型。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.dtypes)
输出:
name object
age int64
gender object
salary int64
city object
dtype: object
该方法返回一个包含数据框主要数值变量的摘要统计信息的数据框。例如:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.describe())
输出:
age salary
count 100.000000 100.000000
mean 29.350000 6187.000000
std 6.372672 2570.269848
min 18.000000 2000.000000
25% 24.750000 4000.000000
50% 29.500000 5500.000000
75% 34.000000 8000.000000
max 45.000000 9900.000000