📜  按小时绘制 pandas - Python (1)

📅  最后修改于: 2023-12-03 15:10:08.953000             🧑  作者: Mango

按小时绘制 pandas - Python

Pandas是一个强大的数据处理工具。它支持多种数据格式和数据类型,并提供了易于使用的方法和工具,使数据处理变得更加容易、可靠和高效。其中之一就是进行时间序列的分析,而按小时绘制就是其中的一种数据分析方法。本文将介绍如何使用pandas绘制按小时数据。

要求
  • Python 3.x
  • Pandas
  • Matplotlib
数据集

我们使用一个气象站的气温数据来演示。

import pandas as pd

data = pd.read_csv('temperature.csv')
data.head()

Output:
                  date  temperature
0  2016-11-01 00:00:00          5.0
1  2016-11-01 01:00:00          4.4
2  2016-11-01 02:00:00          4.4
3  2016-11-01 03:00:00          4.4
4  2016-11-01 04:00:00          3.9
数据预处理

在进行绘图前,需要进行数据预处理,以便更好地进行可视化分析。这里将时间列作为 index,并将其转换为 pandas 中的日期时间对象。

data = pd.read_csv('temperature.csv', index_col='date', infer_datetime_format=True, parse_dates=True)
data.head()

Output:
                     temperature
date                            
2016-11-01 00:00:00          5.0
2016-11-01 01:00:00          4.4
2016-11-01 02:00:00          4.4
2016-11-01 03:00:00          4.4
2016-11-01 04:00:00          3.9
绘制折线图

现在,我们可以绘制按小时的数据了。这里我们绘制一条气温曲线。绘制折线图可以使用 Matplotlib 库。

import matplotlib.pyplot as plt

plt.plot(data['temperature'])
plt.show()

hourly_plot

绘制箱式图

除了使用折线图进行数据可视化,我们还可以使用箱式图。箱式图显示了数据的中位数、四分位数、最小值和最大值,以及任何异常值。这里我们绘制一个箱式图来查看气温的分布情况。

plt.boxplot(data['temperature'], vert=False)
plt.show()

hourly_boxplot

总结

本文介绍了如何使用 Pandas 和 Matplotlib 在 Python 中绘制按小时的数据。我们首先读取并预处理数据,然后使用折线图和箱式图进行数据可视化。掌握这些技能将有助于我们更好地理解和分析时间序列数据。