📅  最后修改于: 2023-12-03 15:22:23.668000             🧑  作者: Mango
在 Pandas 中,可以使用字符串数据来构造 DataFrame,这样就可以将一些常见的数据从外部数据源中导入到 DataFrame 中方便进行数据分析。
可以使用 pandas.DataFrame() 函数来构造 DataFrame,具体操作如下:
import pandas as pd
data = {'Name':['Tom', 'Jerry', 'Spike', 'Tyke'],
'Age':[5, 6, 2, 1],
'Gender':['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
print(df)
输出结果为:
Name Age Gender
0 Tom 5 M
1 Jerry 6 M
2 Spike 2 M
3 Tyke 1 F
从上述代码中,可以看出使用字典来构造 DataFrame,其中字典的 key 为列名,value 为列的数据。可以将多个字典组合成一个列表来构造 DataFrame。
通常情况下,我们需要从外部数据源中导入数据到 DataFrame 中,常见的格式有 csv、excel、json 等等。
以 csv 文件为例,可以使用 pandas.read_csv() 函数来导入 csv 文件中的数据,具体操作如下:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
但前提是需要先在当前目录下找到相应的 csv 文件。
导入数据后,通常需要对数据进行分析和操作。DataFrame 类内置了多个方法来对数据进行处理,如排序、分组、筛选等等。
例如对 DataFrame 按照某一列进行升序排序,可以使用 sort_values() 函数,具体操作如下:
import pandas as pd
data = {'Name':['Tom', 'Jerry', 'Spike', 'Tyke'],
'Age':[5, 6, 2, 1],
'Gender':['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
df = df.sort_values(by='Age')
print(df)
输出结果为:
Name Age Gender
3 Tyke 1 F
2 Spike 2 M
0 Tom 5 M
1 Jerry 6 M
从上述代码中,可以看出使用 sort_values() 函数按照 Age 列进行升序排序,by 参数指定按照哪一列进行排序。
可以使用字符串数据来构造 DataFrame,在 Pandas 中使用 DataFrame 的方法对数据进行分析和操作,方便快捷。通过本篇文章的介绍,同学们应该对 Pandas 中使用字符串数据构造 DataFrame 有了更深入的理解。