📜  如何使用 Pandas 在Python中创建虚拟变量?

📅  最后修改于: 2022-05-13 01:55:24.826000             🧑  作者: Mango

如何使用 Pandas 在Python中创建虚拟变量?

数据集可能包含各种类型的值,有时它由分类值组成。因此,为了有效地使用这些分类值进行编程,我们创建了虚拟变量。虚拟变量是一个二元变量,表示单独的分类变量是否具有特定值。

解释:

如您所见,为温度属性的三个分类值创建了三个虚拟变量。我们可以使用get_dummies()方法在Python中创建虚拟变量。

循序渐进的方法:

  • 导入必要的模块
  • 考虑数据
  • 对数据执行操作以获得哑元

示例 1:

Python3
# import required modules
import pandas as pd
import numpy as np
 
# create dataset
df = pd.DataFrame({'Temperature': ['Hot', 'Cold', 'Warm', 'Cold'],
                   })
 
# display dataset
print(df)
 
# create dymmy variables
pd.get_dummies(df)


Python3
# import required modules
import pandas as pd
import numpy as np
 
# create dataset
s = pd.Series(list('abca'))
 
# display dataset
print(s)
 
# create dymmy variables
pd.get_dummies(s)


Python3
# import required modules
import pandas as pd
import numpy as np
 
# create dataset
df = pd.DataFrame({'A': ['hello', 'vignan', 'geeks'],
                   'B': ['vignan', 'hello', 'hello'],
                   'C': [1, 2, 3]})
 
# display dataset
print(df)
 
# create dymmy variables
pd.get_dummies(df)


输出:

示例 2:

考虑使用 List 数组来获取虚拟对象

蟒蛇3

# import required modules
import pandas as pd
import numpy as np
 
# create dataset
s = pd.Series(list('abca'))
 
# display dataset
print(s)
 
# create dymmy variables
pd.get_dummies(s)

输出:

示例 3:

这是另一个示例,用于获取虚拟变量。

蟒蛇3

# import required modules
import pandas as pd
import numpy as np
 
# create dataset
df = pd.DataFrame({'A': ['hello', 'vignan', 'geeks'],
                   'B': ['vignan', 'hello', 'hello'],
                   'C': [1, 2, 3]})
 
# display dataset
print(df)
 
# create dymmy variables
pd.get_dummies(df)

输出: