📅  最后修改于: 2023-12-03 15:36:47.617000             🧑  作者: Mango
在实际的数据分析中,我们经常需要处理多个数据集。为了能够直观地理解各个数据之间的关系,我们需要通过可视化将数据呈现出来。
当我们需要将多个数据集进行可视化时,我们通常会选择以下几种方式:
当我们需要将两个及以上的数据集进行可视化时,我们通常需要将其进行合并。合并的方式有多种,例如使用pandas
库的merge()
函数、使用numpy
库的concatenate()
函数等。
具体操作如下:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 生成两个数据
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
df2 = pd.DataFrame({'D': [10, 11, 12], 'E': [13, 14, 15], 'F': [16, 17, 18]})
# 合并数据
df3 = pd.concat([df1, df2], axis=1)
# 可视化
df3.plot()
plt.show()
输出结果如下图所示:
当我们有多个数据集需要可视化时,我们可以使用matplotlib
库将它们分别进行可视化,并使用一下方法将它们组合在一起:
subplot
横向或纵向并列摆放;具体操作如下:
import numpy as np
import matplotlib.pyplot as plt
# 生成两个数据集
x = np.linspace(0, 10)
y1 = x
y2 = x ** 2
# 绘制子图
fig, axes = plt.subplots(nrows=2, ncols=1)
axes[0].plot(x, y1)
axes[1].plot(x, y2)
# 设置图案大小及间距
fig.set_size_inches(6, 8)
plt.subplots_adjust(hspace=0.4)
# 显示
plt.show()
输出结果如下图所示:
matplotlib
库中提供了subplot
功能,该功能可以将不同的数据可视化在同一个画面中。
具体操作如下:
import numpy as np
import matplotlib.pyplot as plt
# 生成两个数据集
x = np.linspace(0, 10)
y1 = x
y2 = x ** 2
# 绘制子图
plt.subplot(211)
plt.plot(x, y1)
plt.subplot(212)
plt.plot(x, y2)
# 显示
plt.show()
输出结果如下图所示: