📅  最后修改于: 2023-12-03 14:44:12.105000             🧑  作者: Mango
In der Datenanalyse und Visualisierung ist das Arbeiten mit CSV-Dateien eine gängige Praxis. Matplotlib bietet verschiedene Möglichkeiten, um CSV-Daten zu lesen und zu visualisieren. In diesem Artikel werden wir lernen, wie man CSV-Dateien in matplotlib anpasst und verwendet.
Bevor wir mit matplotlib arbeiten, müssen wir unsere Daten in Python lesen. Pandas ist eine weit verbreitete Bibliothek, die verwendet wird, um Strukturen wie DataFrames und Serie zu erstellen und zu manipulieren. Wir können die read_csv()
funktion von pandas verwenden, um die CSV-Datei in Python zu lesen.
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head()) # Ausgabe zur Überprüfung
In diesem Beispiel verwenden wir pd.read_csv()
um unsere CSV-Datei zu lesen und speichern sie in data
. Um sicherzustellen, dass unsere Daten korrekt gelesen wurden, geben wir die ersten fünf Zeilen unserer Daten durch die head()
Funktion aus.
Sobald wir unsere Daten gelesen haben, können wir sie bearbeiten und selektieren. Das DataFrame
Objekt von pandas kommt mit integrierten Methoden, um Daten auszuwählen, filtern, neu modellieren und zusammenzufassen.
# Daten auswählen
x = data['Datum']
y = data['Wert']
# Plot erstellen
plt.plot(x, y)
plt.show()
In diesem Beispiel wählen wir aus unserem data
DataFrame den Wert des Datum
und den Wert
aus und speichern sie in x
und y
. Dann verwenden wir plt.plot()
um einen einfachen Plot zu erstellen und plt.show()
um ihn anzuzeigen.
Die Standardformate des Plots können durch matplotlib
vorgegeben sein, aber wir können sie an unsere eigenen Bedürfnisse anpassen. Wir können verschiedene Methoden und Optionen verwenden, um unser Diagramm zu personalisieren.
# Plot erstellen
plt.plot(x, y, color='blue', linestyle='dotted', linewidth=1, marker='o', markersize=4, label='Wert')
plt.title('Wert vs Datum')
plt.xlabel('Datum')
plt.ylabel('Wert')
plt.legend()
plt.show()
In diesem Beispiel haben wir einige Anpassungen gemacht, um unseren Plot persönlicher zu gestalten. Durch das Hinzufügen von Farbe, Linienart, Linienbreite, Marker und Markergröße haben wir unser Diagramm deutlich lesbarer gemacht. Wir haben auch eine Legende hinzugefügt, um unsere Daten zu erklären.
In vielen Fällen werden wir in unserer CSV-Datei Datumswerte finden. Um diese Daten in matplotlib ordnungsgemäß zu interpretieren, müssen wir sie im passenden Format konvertieren.
# Daten auswählen
x = pd.to_datetime(data['Datum'], format='%Y-%m-%d')
y = data['Wert']
# Plot erstellen
plt.plot(x, y, color='blue', linestyle='dotted', linewidth=1, marker='o', markersize=4, label='Wert')
plt.title('Wert vs Datum')
plt.xlabel('Datum')
plt.ylabel('Wert')
plt.legend()
plt.show()
In diesem Beispiel haben wir das to_datetime()
Funktion aus Pandas verwendet, um unsere Datumswerte im passenden Format zu konvertieren. Wir haben dann den x
Wert des Plots geändert, um das Datum im richtigen Format zu haben.
In diesem Artikel haben wir gelernt, wie man CSV-Dateien in matplotlib anpasst und verwendet. Wir haben gesehen, wie man CSV-Dateien liest, Daten auswählt und manipuliert, das Erscheinungsbild des Plots anpasst und Datumswerte formatiert.
Matplotlib ist eine mächtige Bibliothek, die eine Vielzahl von Visualisierungsfunktionen bietet. Sie kann in Kombination mit Pandas verwendet werden, um Daten effektiv zu lesen, zu analysieren und darzustellen. Wir hoffen, dass Ihnen dieser Artikel half, Matplotlib zu erlernen und Ihre Fähigkeiten in der Datenanalyse und Visualisierung zu verbessern.