📅  最后修改于: 2023-12-03 14:55:30.239000             🧑  作者: Mango
在Python中,使用数组来构建DataFrame(数据框)是一种非常常用的方法。DataFrame是一个二维,大小可变的表格,其中可以存储不同类型的数据(整数,浮点数,字符串等)。在Python中,使用pandas库来操作DataFrame。
可以使用pandas库中的DataFrame
函数来创建DataFrame。以下是一个例子:
import pandas as pd
data = {'name': ['John', 'Mike', 'Sara'],
'age': [25, 30, 20],
'city': ['New York', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)
print(df)
输出:
name age city
0 John 25 New York
1 Mike 30 Paris
2 Sara 20 Tokyo
可以看到,我们使用一个字典来创建DataFrame,其中键是列名,值是列数据。使用DataFrame
函数,将字典传递给它,就可以创建DataFrame对象。
要从数组中创建DataFrame,需要将数组转换为字典,并使用上面介绍的方式创建DataFrame。以下是一个例子:
import numpy as np
import pandas as pd
data = np.array([['John', 25, 'New York'],
['Mike', 30, 'Paris'],
['Sara', 20, 'Tokyo']])
df = pd.DataFrame(data, columns=['name', 'age', 'city'])
print(df)
输出:
name age city
0 John 25 New York
1 Mike 30 Paris
2 Sara 20 Tokyo
在此例中,我们将一个二维数组传递给DataFrame
函数,并指定列名。如果数组中没有列名,则可以省略columns
参数。
默认情况下,DataFrame中的每一行都有一个整数索引(从0开始),可以使用index
参数来设置自定义索引。以下是一个例子:
import numpy as np
import pandas as pd
data = np.array([['John', 25, 'New York'],
['Mike', 30, 'Paris'],
['Sara', 20, 'Tokyo']])
df = pd.DataFrame(data, columns=['name', 'age', 'city'], index=['a', 'b', 'c'])
print(df)
输出:
name age city
a John 25 New York
b Mike 30 Paris
c Sara 20 Tokyo
在此例中,我们使用index
参数将自定义索引'a','b','c'指定DataFrame中的行。
可以使用以下方法访问DataFrame的元素:
df['name']
loc
方法,例如:df.loc['a']
loc
方法,例如:df.loc['a', 'name']
以下是一个例子:
import numpy as np
import pandas as pd
data = np.array([['John', 25, 'New York'],
['Mike', 30, 'Paris'],
['Sara', 20, 'Tokyo']])
df = pd.DataFrame(data, columns=['name', 'age', 'city'], index=['a', 'b', 'c'])
print(df['name']) # 列访问
print(df.loc['a']) # 行访问
print(df.loc['a', 'name']) # 元素访问
输出:
a John
b Mike
c Sara
Name: name, dtype: object
name John
age 25
city New York
Name: a, dtype: object
John
可以使用上述方法之一访问DataFrame的元素,并对其进行修改,例如:
df.loc['a', 'age'] = 30
print(df)
输出:
name age city
a John 30 New York
b Mike 30 Paris
c Sara 20 Tokyo
可以使用drop
方法删除DataFrame中的元素,例如:
df = df.drop('c')
print(df)
输出:
name age city
a John 30 New York
b Mike 30 Paris
在Python中,使用数组来构建DataFrame是非常常用的方法之一。可以使用pandas库中的DataFrame
函数来创建DataFrame,也可以将数组转换为字典,并使用上述方法创建DataFrame。DataFrame具有许多有用的方法,可以用于访问,修改和删除元素。