如何使用 Pandas 创建相关矩阵?
相关性是一种统计技术,显示两个变量如何相关。 Pandas dataframe.corr() 方法用于创建相关矩阵。它用于查找数据框中所有列的成对相关性。任何 na 值都会被自动排除。对于数据框中的任何非数字数据类型列,它都会被忽略。
要使用 pandas 创建相关矩阵,应采取以下步骤:
- 获取数据。
- 使用 Pandas 创建 DataFrame。
- 使用 Pandas 创建相关矩阵
示例 1:
Python3
# import pandas
import pandas as pd
# obtaining the data
data = {'A': [45, 37, 42],
'B': [38, 31, 26],
'C': [10, 15, 17]
}
# creation of DataFrame
df = pd.DataFrame(data)
# creation of correlation matrix
corrM = df.corr()
corrM
Python3
import pandas as pd
data = {'A': [45, 37, 42, 50],
'B': [38, 31, 26, 90],
'C': [10, 15, 17, 100],
'D': [60, 99, 23, 56],
'E': [76, 98, 78, 90]
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
Python3
import pandas as pd
# Integer and string values can
# never be correlated.
data = {'A': [45, 37, 42, 50],
'B': ['R', 'O', 'M', 'Y'],
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
Python3
import pandas as pd
data = {'A': [45, 37, 42, 50],
'B': ['R', 'O', 'M', 'Y'],
'C': [56, 67, 68, 60],
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
输出:
对角线的值显示变量与其自身的相关性,因此对角线显示相关性 1。
示例 2:
Python3
import pandas as pd
data = {'A': [45, 37, 42, 50],
'B': [38, 31, 26, 90],
'C': [10, 15, 17, 100],
'D': [60, 99, 23, 56],
'E': [76, 98, 78, 90]
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
输出:
示例 3:
Python3
import pandas as pd
# Integer and string values can
# never be correlated.
data = {'A': [45, 37, 42, 50],
'B': ['R', 'O', 'M', 'Y'],
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
输出:
示例 4:
Python3
import pandas as pd
data = {'A': [45, 37, 42, 50],
'B': ['R', 'O', 'M', 'Y'],
'C': [56, 67, 68, 60],
}
df = pd.DataFrame(data)
corrM = df.corr()
corrM
输出: