📅  最后修改于: 2023-12-03 15:34:24.927000             🧑  作者: Mango
DataFrame是Pandas库中的一个数据结构,它是由行和列组成的二维表格结构。每列可以是不同的数据类型(例如字符串、整数或浮点数等)。
import pandas as pd
df = pd.read_csv('my_data.csv')
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
import numpy as np
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data, index=['a', 'b', 'c', 'd'])
使用head()方法来展示DataFrame的前几行,默认为前五行。
df.head()
使用tail()方法来展示DataFrame的后几行,默认为后五行。
df.tail()
df['name'] # 选择一列
df[['name', 'age']] # 选择多列
df['height'] = np.array([165, 180, 173, 190])
df.drop('age', axis=1, inplace=True)
df.loc['b'] # 选择一行
df.loc[['b', 'c']] # 选择多行
df.iloc[2] # 选择一行
df.iloc[1:3] # 选择多行
new_data = {'name': 'Eva', 'age': 28, 'gender': 'F', 'height': 170}
df = df.append(new_data, ignore_index=True)
df.drop(2, axis=0, inplace=True)
df.describe() # 得到 DataFrame 的描述性统计信息
df.mean() # 计算df每一列的平均值
df.median() # 计算df每一列的中位数
df.std() # 计算df每一列的标准差
DataFrame是一个非常有用的数据结构,它可以让我们轻松地处理数据集。在Python中使用DataFrame可以非常方便地进行数据清理和分析,而Pandas库则是Python中最流行的数据分析工具之一。