📌  相关文章
📜  来自数组的数据框python(1)

📅  最后修改于: 2023-12-03 14:55:30.239000             🧑  作者: Mango

来自数组的数据框Python

在Python中,使用数组来构建DataFrame(数据框)是一种非常常用的方法。DataFrame是一个二维,大小可变的表格,其中可以存储不同类型的数据(整数,浮点数,字符串等)。在Python中,使用pandas库来操作DataFrame。

创建DataFrame

可以使用pandas库中的DataFrame函数来创建DataFrame。以下是一个例子:

import pandas as pd

data = {'name': ['John', 'Mike', 'Sara'],
        'age': [25, 30, 20],
        'city': ['New York', 'Paris', 'Tokyo']}

df = pd.DataFrame(data)
print(df)

输出:

   name  age      city
0  John   25  New York
1  Mike   30     Paris
2  Sara   20     Tokyo

可以看到,我们使用一个字典来创建DataFrame,其中键是列名,值是列数据。使用DataFrame函数,将字典传递给它,就可以创建DataFrame对象。

从数组创建DataFrame

要从数组中创建DataFrame,需要将数组转换为字典,并使用上面介绍的方式创建DataFrame。以下是一个例子:

import numpy as np
import pandas as pd

data = np.array([['John', 25, 'New York'],
                 ['Mike', 30, 'Paris'],
                 ['Sara', 20, 'Tokyo']])

df = pd.DataFrame(data, columns=['name', 'age', 'city'])
print(df)

输出:

   name age      city
0  John  25  New York
1  Mike  30     Paris
2  Sara  20     Tokyo

在此例中,我们将一个二维数组传递给DataFrame函数,并指定列名。如果数组中没有列名,则可以省略columns参数。

设置索引

默认情况下,DataFrame中的每一行都有一个整数索引(从0开始),可以使用index参数来设置自定义索引。以下是一个例子:

import numpy as np
import pandas as pd

data = np.array([['John', 25, 'New York'],
                 ['Mike', 30, 'Paris'],
                 ['Sara', 20, 'Tokyo']])

df = pd.DataFrame(data, columns=['name', 'age', 'city'], index=['a', 'b', 'c'])
print(df)

输出:

   name age      city
a  John  25  New York
b  Mike  30     Paris
c  Sara  20     Tokyo

在此例中,我们使用index参数将自定义索引'a','b','c'指定DataFrame中的行。

访问DataFrame元素

可以使用以下方法访问DataFrame的元素:

  • 列访问:使用列名作为键,例如:df['name']
  • 行访问:使用loc方法,例如:df.loc['a']
  • 元素访问:使用loc方法,例如:df.loc['a', 'name']

以下是一个例子:

import numpy as np
import pandas as pd

data = np.array([['John', 25, 'New York'],
                 ['Mike', 30, 'Paris'],
                 ['Sara', 20, 'Tokyo']])

df = pd.DataFrame(data, columns=['name', 'age', 'city'], index=['a', 'b', 'c'])
print(df['name'])   # 列访问
print(df.loc['a'])  # 行访问
print(df.loc['a', 'name'])  # 元素访问

输出:

a    John
b    Mike
c    Sara
Name: name, dtype: object
name          John
age             25
city     New York
Name: a, dtype: object
John
修改DataFrame元素

可以使用上述方法之一访问DataFrame的元素,并对其进行修改,例如:

df.loc['a', 'age'] = 30
print(df)

输出:

   name age      city
a  John  30  New York
b  Mike  30     Paris
c  Sara  20     Tokyo
删除DataFrame元素

可以使用drop方法删除DataFrame中的元素,例如:

df = df.drop('c')
print(df)

输出:

   name age      city
a  John  30  New York
b  Mike  30     Paris
总结

在Python中,使用数组来构建DataFrame是非常常用的方法之一。可以使用pandas库中的DataFrame函数来创建DataFrame,也可以将数组转换为字典,并使用上述方法创建DataFrame。DataFrame具有许多有用的方法,可以用于访问,修改和删除元素。