📅  最后修改于: 2023-12-03 15:32:51.559000             🧑  作者: Mango
在数据可视化中,平行坐标图是一种常用的多变量可视化工具,它可以同时展示多个相互作用的维度。Matplotlib 提供了一个方便的模块 matplotlib.pyplot.parallel_coordinates()
来创建平行坐标图,让我们快速地将高维数据转化为可视化的图表。
matplotlib.pyplot.parallel_coordinates()
的基本用法如下:
import matplotlib.pyplot as plt
from pandas.plotting import parallel_coordinates
import pandas as pd
# 加载数据
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
# 绘制平行坐标图
plt.figure()
parallel_coordinates(iris, 4, color=['#556270', '#4ECDC4', '#C7F464'])
plt.show()
上面的代码中,我们使用了 Python 中的数据分析库 Pandas 来加载鸢尾花数据集,并使用 parallel_coordinates()
函数绘制了平行坐标图。其中 iris
为数据集的对象,第二个参数 4
代表需要绘制第 4 列数据(即花的种类)。color
参数用来指定图表中每个组的颜色。
平行坐标图是一种很直观、易于理解的多维数据可视化方法,它可以很好地展示不同维度之间的关系和趋势,并且能够帮助我们发现隐藏在数据中的规律和趋势。
matplotlib.pyplot.parallel_coordinates()
的主要参数说明如下:
frame
:包含数据的 DataFrame 或数组。class_column
:分类标签所在的列数或列名。cols
:要使用的列数或列名。默认使用所有列。ax
:将图形绘制在该轴上。默认使用当前轴。color
:每个类别的颜色。可以使用单个颜色值或一个包含颜色的列表。colormap
:一个用于将类别映射到颜色的 Colormap 对象。alpha
:线条透明度。linewidth
:线条宽度。xticks
:用于指定 x 轴刻度位置的列表(或者函数)。xlabel
:x 轴标签。ylabel
:y 轴标签。下面是另一个示例代码:
# 加载数据
df = pd.read_csv('https://raw.githubusercontent.com/resbaz/r-novice-gapminder-files/master/data/gapminder-FiveYearData.csv')
# 只保留 GDP、生存率、和出生率三列数据
data = df[['year', 'continent', 'gdpPercap', 'lifeExp', 'pop']]
# 绘制平行坐标图
plt.figure()
parallel_coordinates(data, 'continent')
plt.show()
以上代码中,我们使用 pd.read_csv()
加载了 gapminder 数据集,并选取了三个关键列进行可视化。'continent'
参数用来指定分类标签所在的列名。
平行坐标图是一种优雅、具有实用价值的多维数据可视化方法,Matplotlib 的 parallel_coordinates()
函数提供了便捷的工具来实现平行坐标图的绘制,为数据分析带来了诸多便利。