📜  如何使用 Pandas 创建相关矩阵?

📅  最后修改于: 2022-05-13 01:54:23.315000             🧑  作者: Mango

如何使用 Pandas 创建相关矩阵?

相关性是一种统计技术,显示两个变量如何相关。 Pandas dataframe.corr() 方法用于创建相关矩阵。它用于查找数据框中所有列的成对相关性。任何 na 值都会被自动排除。对于数据框中的任何非数字数据类型列,它都会被忽略。
要使用 pandas 创建相关矩阵,应采取以下步骤:

  1. 获取数据。
  2. 使用 Pandas 创建 DataFrame。
  3. 使用 Pandas 创建相关矩阵

示例 1:

Python3
# import pandas
import pandas as pd
 
# obtaining the data
data = {'A': [45, 37, 42],
        'B': [38, 31, 26],
        'C': [10, 15, 17]
        }
# creation of DataFrame
df = pd.DataFrame(data)
 
# creation of correlation matrix
corrM = df.corr()
 
corrM


Python3
import pandas as pd
 
data = {'A': [45, 37, 42, 50],
        'B': [38, 31, 26, 90],
        'C': [10, 15, 17, 100],
        'D': [60, 99, 23, 56],
        'E': [76, 98, 78, 90]
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM


Python3
import pandas as pd
 
# Integer and string values can
# never be correlated.
data = {'A': [45, 37, 42, 50],
        'B': ['R', 'O', 'M', 'Y'],
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM


Python3
import pandas as pd
 
data = {'A': [45, 37, 42, 50],
        'B': ['R', 'O', 'M', 'Y'],
        'C': [56, 67, 68, 60],
               
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM


输出:

熊猫-矩阵-1

对角线的值显示变量与其自身的相关性,因此对角线显示相关性 1。

示例 2:

Python3

import pandas as pd
 
data = {'A': [45, 37, 42, 50],
        'B': [38, 31, 26, 90],
        'C': [10, 15, 17, 100],
        'D': [60, 99, 23, 56],
        'E': [76, 98, 78, 90]
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM

输出:

熊猫矩阵 2

示例 3:

Python3

import pandas as pd
 
# Integer and string values can
# never be correlated.
data = {'A': [45, 37, 42, 50],
        'B': ['R', 'O', 'M', 'Y'],
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM

输出:

python-矩阵-3

示例 4:

Python3

import pandas as pd
 
data = {'A': [45, 37, 42, 50],
        'B': ['R', 'O', 'M', 'Y'],
        'C': [56, 67, 68, 60],
               
        }
 
df = pd.DataFrame(data)
 
corrM = df.corr()
corrM

输出:

蟒蛇矩阵5