使用 Pairplot Seaborn 和 Pandas 进行数据可视化
数据可视化是以图形格式呈现数据。它对于数据分析非常重要,主要是因为以数据为中心的Python包的奇妙生态系统。它有助于理解数据,然而,它是复杂的,通过以简单易懂的格式总结和呈现大量数据,有助于清晰有效地传达信息,从而了解数据的重要性。
Pandas 和 Seaborn就是其中之一,它们使导入和分析数据变得更加容易。在本文中,我们将使用 Pandas 和Pairplot Seaborn 来分析数据。
熊猫
Pandas提供用于清理和处理数据的工具。它是最流行的用于数据分析的Python库。在 Pandas 中,数据表称为数据框。
因此,让我们从创建Pandas 数据框开始:
示例 1:
Python3
# Python code demonstrate creating
import pandas as pd
# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
'Age':[ 30 , 21 , 29 , 28 ]}
# Create DataFrame
df = pd.DataFrame( data )
# Print the output.
display(df)
Python3
# import module
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# show first 5 column
data.head()
Python3
# importing packages
import seaborn
import matplotlib.pyplot as plt
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()
Python3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# pairplot
seaborn.pairplot(data)
Python3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')
Python3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
plot_kws = {'edgecolor': 'k'}, size = 4)
输出:
示例2:从系统加载CSV数据并通过pandas显示。
蟒蛇3
# import module
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# show first 5 column
data.head()
输出:
seaborn.pairplot()
要在数据集中绘制多个成对双变量分布,您可以使用 pairplot()函数。这将 DataFrame 中 (n, 2) 变量组合的关系显示为图矩阵,对角线图是单变量图。
Syntax: seaborn.pairplot( data, \*\*kwargs )
Parameter:
data: Tidy (long-form) dataframe where each column is a variable and each row is an observation.
hue: Variable in “data“ to map plot aspects to different colors.
palette: dict or seaborn color palette
{x, y}_vars: lists of variable names, optional
dropna: boolean, optional
示例 1:
蟒蛇3
# importing packages
import seaborn
import matplotlib.pyplot as plt
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()
输出:
使用 Pairplot Seaborn 和 pandas 进行数据可视化
我们将看到如何创建 Pandas 数据框和 Pairplot。我们将使用 Pandas 通过 pairplot 可视化数据
示例 1:
在这个例子中,我们将简单地绘制一个带有 Pandas 数据框的配对图。在这里,我们只是加载 nba.csv 数据并创建一个数据框,尽管在 pairplot 中作为参数传递。
蟒蛇3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# pairplot
seaborn.pairplot(data)
输出:
示例 2:
在此示例中,我们将使用色调属性来可视化特定列。
蟒蛇3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')
输出:
示例 3:
在这个例子中,我们将传递双变量绘图函数的关键字参数的字典( plot_kws 和diag_kws )
蟒蛇3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
plot_kws = {'edgecolor': 'k'}, size = 4)
输出: