📜  玩具数据框 df simple - Python (1)

📅  最后修改于: 2023-12-03 15:40:50.448000             🧑  作者: Mango

玩具数据框 df simple - Python

df simple 是一个在 Python 中十分有用的数据框架,可以方便地处理和分析数据。本文将介绍 df simple 的基本用法,包括创建数据框架、插入数据、删除数据、修改数据、查询数据、排序数据和组合数据。

创建数据框架

要创建一个数据框架,可以使用 pandas.DataFrame 类。首先需要引入 pandas 模块,然后可以使用以下代码创建一个空数据框架:

import pandas as pd

df = pd.DataFrame()

也可以指定数据框架的列名和行名:

data = {'Name': ['John', 'Mary', 'Adam'],
        'Age': [25, 27, 30],
        'City': ['New York', 'Paris', 'London']}

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'], index=['a', 'b', 'c'])
插入数据

要在数据框架中插入数据,可以直接为某一列赋值:

df['Gender'] = ['M', 'F', 'M']

也可以使用 loc 方法插入一行数据:

df.loc['d'] = ['Jessica', 24, 'Berlin', 'F']
删除数据

要删除数据框架中的一行或一列,可以使用 drop 方法:

df.drop('d', inplace=True)  # 删除行 'd'
df.drop(columns=['Gender'], inplace=True)  # 删除列 'Gender'
修改数据

要修改数据框架中的数据,可以直接为某一单元格赋值:

df.at['a', 'City'] = 'Los Angeles'

也可以使用 iat 方法按索引修改数据:

df.iat[0, 2] = 'San Francisco'
查询数据

要查询数据框架中的数据,可以通过列名、行名或索引来访问:

print(df['Name'])
print(df.loc[['a', 'c'], ['Name', 'City']])
print(df.iloc[1:3, 0:2])

也可以使用 query 方法进行复杂的查询:

print(df.query("Age > 25 and City == 'New York'"))
排序数据

要对数据框架中的数据进行排序,可以使用 sort_values 方法:

df.sort_values(by=['Age'], inplace=True)
df.sort_values(by=['Age', 'Name'], ascending=[False, True], inplace=True)

也可以使用 sort_index 方法按行名或索引排序:

df.sort_index(inplace=True)
组合数据

要将多个数据框架组合在一起,可以使用 concat 方法:

data1 = {'Name': ['John', 'Mary', 'Adam'],
        'Age': [25, 27, 30],
        'City': ['New York', 'Paris', 'London']}

data2 = {'Name': ['Jessica', 'Scott'],
        'Age': [24, 26],
        'City': ['Berlin', 'Tokyo']}

df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

df = pd.concat([df1, df2], ignore_index=True)

除了 concat 方法,还可以使用 merge 方法按某一列或多个列的数据进行合并。

以上就是 df simple 的基本用法介绍了。数据框架是数据分析中的重要工具,掌握了基本的用法之后,可以更加高效地处理和分析数据。