📌  相关文章
📜  使用字符串数据在 Pandas 中构造 DataFrame(1)

📅  最后修改于: 2023-12-03 15:22:23.668000             🧑  作者: Mango

使用字符串数据在 Pandas 中构造 DataFrame

在 Pandas 中,可以使用字符串数据来构造 DataFrame,这样就可以将一些常见的数据从外部数据源中导入到 DataFrame 中方便进行数据分析。

1. 使用字符串构造 DataFrame

可以使用 pandas.DataFrame() 函数来构造 DataFrame,具体操作如下:

import pandas as pd

data = {'Name':['Tom', 'Jerry', 'Spike', 'Tyke'],
        'Age':[5, 6, 2, 1],
        'Gender':['M', 'M', 'M', 'F']}

df = pd.DataFrame(data)

print(df)

输出结果为:

    Name  Age Gender
0    Tom    5      M
1  Jerry    6      M
2  Spike    2      M
3   Tyke    1      F

从上述代码中,可以看出使用字典来构造 DataFrame,其中字典的 key 为列名,value 为列的数据。可以将多个字典组合成一个列表来构造 DataFrame。

2. 将数据导入到 DataFrame 中

通常情况下,我们需要从外部数据源中导入数据到 DataFrame 中,常见的格式有 csv、excel、json 等等。

以 csv 文件为例,可以使用 pandas.read_csv() 函数来导入 csv 文件中的数据,具体操作如下:

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

但前提是需要先在当前目录下找到相应的 csv 文件。

3. DataFrame 中的数据操作

导入数据后,通常需要对数据进行分析和操作。DataFrame 类内置了多个方法来对数据进行处理,如排序、分组、筛选等等。

例如对 DataFrame 按照某一列进行升序排序,可以使用 sort_values() 函数,具体操作如下:

import pandas as pd

data = {'Name':['Tom', 'Jerry', 'Spike', 'Tyke'],
        'Age':[5, 6, 2, 1],
        'Gender':['M', 'M', 'M', 'F']}

df = pd.DataFrame(data)

df = df.sort_values(by='Age')

print(df)

输出结果为:

    Name  Age Gender
3   Tyke    1      F
2  Spike    2      M
0    Tom    5      M
1  Jerry    6      M

从上述代码中,可以看出使用 sort_values() 函数按照 Age 列进行升序排序,by 参数指定按照哪一列进行排序。

4. 结论

可以使用字符串数据来构造 DataFrame,在 Pandas 中使用 DataFrame 的方法对数据进行分析和操作,方便快捷。通过本篇文章的介绍,同学们应该对 Pandas 中使用字符串数据构造 DataFrame 有了更深入的理解。