Python|熊猫 Dataframe.to_dict()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas .to_dict()
方法用于根据 orient 参数将数据帧转换为系列字典或类似数据类型的列表。
Syntax: DataFrame.to_dict(orient=’dict’, into=)
Parameters:
orient: String value, (‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’) Defines which dtype to convert Columns(series into). For example, ‘list’ would return a dictionary of lists with Key=Column name and Value=List (Converted series).
into: class, can pass an actual class or instance. For example in case of defaultdict instance of class can be passed. Default value of this parameter is dict.
Return type: Dataframe converted into Dictionary
要下载以下示例中使用的数据集,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
示例 #1:默认转换为字典字典
在这种情况下,没有参数传递给to_dict()
方法。因此,默认情况下它将数据帧转换为字典字典。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# converting to dict
data_dict = data.to_dict()
# display
data_dict
输出:
如输出图像所示,字典字典由 to_dict() 方法返回。第一个字典的键是列名,该列以索引作为第二个字典的键存储。
示例 #2:转换为系列字典
在此示例中,“系列”被传递给 orient 参数以将数据框转换为系列字典。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# converting to dict
data_dict = data.to_dict('series')
# printing datatype of first keys value in dict
print(type(data_dict['Name']))
# display
data_dict
输出:
如输出图像所示,由于 data_dict['Name'] 的类型是 pandas.core.series.Series,因此 to_dict() 返回了一个系列字典。