📅  最后修改于: 2023-12-03 15:10:19.144000             🧑  作者: Mango
数据框是 Pandas 库中非常重要的数据结构之一。它是一个二维表格,可以存储不同类型的数据,并且具有行和列的标签。
在 Python 中可以使用多种方式来创建数据框。最常用的方式是使用字典和列表。
可以使用字典来创建数据框,其中字典的键是列名,字典的值是列的值。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Paris', 'London']})
print(df)
输出结果为:
name age city
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 35 London
可以使用列表来创建数据框,其中列表的元素也是列表,表示数据框中的每一行。
import pandas as pd
data = [['Alice', 25, 'New York'],
['Bob', 30, 'Paris'],
['Charlie', 35, 'London']]
df = pd.DataFrame(data, columns=['name', 'age', 'city'])
print(df)
输出结果为:
name age city
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 35 London
在 Python 中可以使用多种方式来读取数据框。最常用的方式是使用 CSV 文件和 Excel 文件。
可以使用 Pandas 库中的 read_csv
函数来读取 CSV 文件。
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
可以使用 Pandas 库中的 read_excel
函数来读取 Excel 文件。
import pandas as pd
df = pd.read_excel('data.xlsx')
print(df)
可以使用多种方式来修改数据框。最常用的方式是修改数据框中的某一列或某一行。
可以使用下标或列名来修改某一列的值。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Paris', 'London']})
# 修改某一列的值
df['age'] = [26, 31, 36]
print(df)
# 使用下标修改某一列的值
df.iloc[:, 1] = [27, 32, 37]
print(df)
可以使用下标或行标签来修改某一行的值。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Paris', 'London']})
# 修改某一行的值
df.loc[0] = ['Alex', 26, 'Chicago']
print(df)
# 使用下标修改某一行的值
df.iloc[1] = ['Betty', 31, 'Berlin']
print(df)
可以使用多种方式来删除数据框中的某一列或某一行。
可以使用下标或列名来删除某一列。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Paris', 'London']})
# 删除某一列
df = df.drop('age', axis=1)
print(df)
# 使用下标删除某一列
df = df.drop(df.columns[0], axis=1)
print(df)
可以使用下标或行标签来删除某一行。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Paris', 'London']})
# 删除某一行
df = df.drop(0)
print(df)
# 使用行标签删除某一行
df = df.drop(1, axis=0)
print(df)
数据框是 Pandas 库中非常重要的数据结构之一。它是一个二维表格,可以存储不同类型的数据,并且具有行和列的标签。在 Python 中可以使用多种方式来创建、读取、修改和删除数据框,使得数据分析变得更加简单和高效。