📅  最后修改于: 2023-12-03 15:40:50.448000             🧑  作者: Mango
df simple
是一个在 Python 中十分有用的数据框架,可以方便地处理和分析数据。本文将介绍 df simple
的基本用法,包括创建数据框架、插入数据、删除数据、修改数据、查询数据、排序数据和组合数据。
要创建一个数据框架,可以使用 pandas.DataFrame
类。首先需要引入 pandas 模块,然后可以使用以下代码创建一个空数据框架:
import pandas as pd
df = pd.DataFrame()
也可以指定数据框架的列名和行名:
data = {'Name': ['John', 'Mary', 'Adam'],
'Age': [25, 27, 30],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'], index=['a', 'b', 'c'])
要在数据框架中插入数据,可以直接为某一列赋值:
df['Gender'] = ['M', 'F', 'M']
也可以使用 loc
方法插入一行数据:
df.loc['d'] = ['Jessica', 24, 'Berlin', 'F']
要删除数据框架中的一行或一列,可以使用 drop
方法:
df.drop('d', inplace=True) # 删除行 'd'
df.drop(columns=['Gender'], inplace=True) # 删除列 'Gender'
要修改数据框架中的数据,可以直接为某一单元格赋值:
df.at['a', 'City'] = 'Los Angeles'
也可以使用 iat
方法按索引修改数据:
df.iat[0, 2] = 'San Francisco'
要查询数据框架中的数据,可以通过列名、行名或索引来访问:
print(df['Name'])
print(df.loc[['a', 'c'], ['Name', 'City']])
print(df.iloc[1:3, 0:2])
也可以使用 query
方法进行复杂的查询:
print(df.query("Age > 25 and City == 'New York'"))
要对数据框架中的数据进行排序,可以使用 sort_values
方法:
df.sort_values(by=['Age'], inplace=True)
df.sort_values(by=['Age', 'Name'], ascending=[False, True], inplace=True)
也可以使用 sort_index
方法按行名或索引排序:
df.sort_index(inplace=True)
要将多个数据框架组合在一起,可以使用 concat
方法:
data1 = {'Name': ['John', 'Mary', 'Adam'],
'Age': [25, 27, 30],
'City': ['New York', 'Paris', 'London']}
data2 = {'Name': ['Jessica', 'Scott'],
'Age': [24, 26],
'City': ['Berlin', 'Tokyo']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
df = pd.concat([df1, df2], ignore_index=True)
除了 concat
方法,还可以使用 merge
方法按某一列或多个列的数据进行合并。
以上就是 df simple
的基本用法介绍了。数据框架是数据分析中的重要工具,掌握了基本的用法之后,可以更加高效地处理和分析数据。