📜  使用 Pairplot Seaborn 和 Pandas 进行数据可视化

📅  最后修改于: 2022-05-13 01:55:33.037000             🧑  作者: Mango

使用 Pairplot Seaborn 和 Pandas 进行数据可视化

数据可视化是以图形格式呈现数据。它对于数据分析非常重要,主要是因为以数据为中心的Python包的奇妙生态系统。它有助于理解数据,然而,它是复杂的,通过以简单易懂的格式总结和呈现大量数据,有助于清晰有效地传达信息,从而了解数据的重要性。

Pandas 和 Seaborn就是其中之一,它们使导入和分析数据变得更加容易。在本文中,我们将使用 Pandas 和Pairplot Seaborn 来分析数据。

熊猫

Pandas提供用于清理和处理数据的工具。它是最流行的用于数据分析的Python库。在 Pandas 中,数据表称为数据框。

因此,让我们从创建Pandas 数据框开始:

示例 1:

Python3
# Python code demonstrate creating 
    
import pandas as pd
    
# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
        'Age':[ 30 , 21 , 29 , 28 ]}
    
# Create DataFrame
df = pd.DataFrame( data )
    
# Print the output.
display(df)


Python3
# import module
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# show first 5 column
data.head()


Python3
# importing packages
import seaborn
import matplotlib.pyplot as plt
 
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
 
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()


Python3
# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# pairplot
seaborn.pairplot(data)


Python3
# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')


Python3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
 
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
             plot_kws = {'edgecolor': 'k'}, size = 4)


输出:

示例2:从系统加载CSV数据并通过pandas显示。

蟒蛇3

# import module
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# show first 5 column
data.head()

输出:

seaborn.pairplot()

要在数据集中绘制多个成对双变量分布,您可以使用 pairplot()函数。这将 DataFrame 中 (n, 2) 变量组合的关系显示为图矩阵,对角线图是单变量图。

示例 1:

蟒蛇3

# importing packages
import seaborn
import matplotlib.pyplot as plt
 
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
 
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()

输出:

使用 Pairplot Seaborn 和 pandas 进行数据可视化

我们将看到如何创建 Pandas 数据框和 Pairplot。我们将使用 Pandas 通过 pairplot 可视化数据

示例 1:

在这个例子中,我们将简单地绘制一个带有 Pandas 数据框的配对图。在这里,我们只是加载 nba.csv 数据并创建一个数据框,尽管在 pairplot 中作为参数传递。

蟒蛇3

# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# pairplot
seaborn.pairplot(data)

输出:

示例 2:

在此示例中,我们将使用色调属性来可视化特定列。

蟒蛇3

# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')

输出:

示例 3:

在这个例子中,我们将传递双变量绘图函数的关键字参数的字典( plot_kws 和diag_kws

蟒蛇3

# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
 
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
             plot_kws = {'edgecolor': 'k'}, size = 4)

输出: