📅  最后修改于: 2023-12-03 15:36:53.425000             🧑  作者: Mango
在 Python 中,数据结构中的字典很常见。在某些情况下,我们可能需要从数据框中创建一个字典,但是我们不希望删除重复项。
要创建字典而不从数据框中删除重复项,我们可以使用 Pandas 库中的 to_dict() 函数。这个函数可以将数据框转换为字典。我们可以使用 'index' 作为参数,以保留重复项。
下面是一个示例:
import pandas as pd
# 创建一个数据框
df = pd.DataFrame({'name': ['John', 'Jane', 'John'],
'age': [23, 25, 23],
'gender': ['male', 'female', 'male']})
# 将数据框转换为字典
dictionary = df.to_dict('index')
print(dictionary)
这将输出以下字典:
{0: {'name': 'John', 'age': 23, 'gender': 'male'},
1: {'name': 'Jane', 'age': 25, 'gender': 'female'},
2: {'name': 'John', 'age': 23, 'gender': 'male'}}
我们可以看到,在转换为字典时,重复项并未被删除。
在上面的代码中,我们创建了一个包含三个行的数据框,并且这个数据框有两个 'John' 的名字。然而,当我们调用 to_dict() 函数时,我们传递了 'index' 参数,这样就保留了重复项。
我们可以使用任何其他的参数(例如 'dict'),以根据我们自己的需求来为字典创建唯一键。
总之,要创建字典而不从数据框中删除重复项,我们只需要使用 Pandas 库中的 to_dict() 函数,并传递参数 'index' 即可。