Python|熊猫 dataframe.corrwith()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.corrwith()
用于计算两个 DataFrame 对象的行或列之间的成对相关性。如果两个数据框对象的形状不同,则相应的相关值将为NaN
值。
Syntax: DataFrame.count(axis=0, level=None, numeric_only=False)
Parameters:
other : DataFrame
axis : 0 or ‘index’ to compute column-wise, 1 or ‘columns’ for row-wise
drop : Drop missing indices from result, default returns union of all
Returns: correls : Series
注:变量与自身的相关性为 1。
示例 #1:使用corrwith()
函数沿列轴查找两个数据框对象之间的相关性
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df1 = pd.DataFrame({"A":[1, 5, 7, 8],
"B":[5, 8, 4, 3],
"C":[10, 4, 9, 3]})
# Creating the second dataframe
df2 = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5]})
# Print the first dataframe
print(df1, "\n")
# Print the second dataframe
print(df2)
现在找到沿行轴的两个数据帧的列之间的相关性。
# To find the correlation among the
# columns of df1 and df2 along the column axis
df1.corrwith(df2, axis = 0)
输出 :
输出系列分别包含两个数据框对象的三列之间的相关性。示例 #2:使用corrwith()
函数沿行轴查找两个数据框对象之间的相关性
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df1 = pd.DataFrame({"A":[1, 5, 7, 8],
"B":[5, 8, 4, 3],
"C":[10, 4, 9, 3]})
# Creating the second dataframe
df2 = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5]})
# To find the correlation among the
# columns of df1 and df2 along the row axis
df1.corrwith(df2, axis = 1)
输出 :
输出序列分别包含两个数据框对象的四行之间的相关性。