📜  matplotlib csv-datei anpassen und verwenden (1)

📅  最后修改于: 2023-12-03 14:44:12.105000             🧑  作者: Mango

Matplotlib: Anpassen und Verwenden von CSV-Dateien

In der Datenanalyse und Visualisierung ist das Arbeiten mit CSV-Dateien eine gängige Praxis. Matplotlib bietet verschiedene Möglichkeiten, um CSV-Daten zu lesen und zu visualisieren. In diesem Artikel werden wir lernen, wie man CSV-Dateien in matplotlib anpasst und verwendet.

Schritt 1: CSV-Datei mit Pandas lesen

Bevor wir mit matplotlib arbeiten, müssen wir unsere Daten in Python lesen. Pandas ist eine weit verbreitete Bibliothek, die verwendet wird, um Strukturen wie DataFrames und Serie zu erstellen und zu manipulieren. Wir können die read_csv()funktion von pandas verwenden, um die CSV-Datei in Python zu lesen.

import pandas as pd

data = pd.read_csv('data.csv')

print(data.head()) # Ausgabe zur Überprüfung

In diesem Beispiel verwenden wir pd.read_csv() um unsere CSV-Datei zu lesen und speichern sie in data. Um sicherzustellen, dass unsere Daten korrekt gelesen wurden, geben wir die ersten fünf Zeilen unserer Daten durch die head()Funktion aus.

Schritt 2: Daten auswählen und manipulieren

Sobald wir unsere Daten gelesen haben, können wir sie bearbeiten und selektieren. Das DataFrameObjekt von pandas kommt mit integrierten Methoden, um Daten auszuwählen, filtern, neu modellieren und zusammenzufassen.

# Daten auswählen
x = data['Datum']
y = data['Wert']

# Plot erstellen
plt.plot(x, y)
plt.show()

In diesem Beispiel wählen wir aus unserem dataDataFrame den Wert des Datum und den Wert aus und speichern sie in xund y. Dann verwenden wir plt.plot()um einen einfachen Plot zu erstellen und plt.show()um ihn anzuzeigen.

Schritt 3: Das Erscheinungsbild des Plots anpassen

Die Standardformate des Plots können durch matplotlib vorgegeben sein, aber wir können sie an unsere eigenen Bedürfnisse anpassen. Wir können verschiedene Methoden und Optionen verwenden, um unser Diagramm zu personalisieren.

# Plot erstellen
plt.plot(x, y, color='blue', linestyle='dotted', linewidth=1, marker='o', markersize=4, label='Wert')
plt.title('Wert vs Datum')
plt.xlabel('Datum')
plt.ylabel('Wert')
plt.legend()
plt.show()

In diesem Beispiel haben wir einige Anpassungen gemacht, um unseren Plot persönlicher zu gestalten. Durch das Hinzufügen von Farbe, Linienart, Linienbreite, Marker und Markergröße haben wir unser Diagramm deutlich lesbarer gemacht. Wir haben auch eine Legende hinzugefügt, um unsere Daten zu erklären.

Schritt 4: Datumswerte formatieren

In vielen Fällen werden wir in unserer CSV-Datei Datumswerte finden. Um diese Daten in matplotlib ordnungsgemäß zu interpretieren, müssen wir sie im passenden Format konvertieren.

# Daten auswählen
x = pd.to_datetime(data['Datum'], format='%Y-%m-%d')
y = data['Wert']

# Plot erstellen
plt.plot(x, y, color='blue', linestyle='dotted', linewidth=1, marker='o', markersize=4, label='Wert')
plt.title('Wert vs Datum')
plt.xlabel('Datum')
plt.ylabel('Wert')
plt.legend()
plt.show()

In diesem Beispiel haben wir das to_datetime()Funktion aus Pandas verwendet, um unsere Datumswerte im passenden Format zu konvertieren. Wir haben dann den xWert des Plots geändert, um das Datum im richtigen Format zu haben.

Fazit

In diesem Artikel haben wir gelernt, wie man CSV-Dateien in matplotlib anpasst und verwendet. Wir haben gesehen, wie man CSV-Dateien liest, Daten auswählt und manipuliert, das Erscheinungsbild des Plots anpasst und Datumswerte formatiert.

Matplotlib ist eine mächtige Bibliothek, die eine Vielzahl von Visualisierungsfunktionen bietet. Sie kann in Kombination mit Pandas verwendet werden, um Daten effektiv zu lesen, zu analysieren und darzustellen. Wir hoffen, dass Ihnen dieser Artikel half, Matplotlib zu erlernen und Ihre Fähigkeiten in der Datenanalyse und Visualisierung zu verbessern.