📜  在 pandad 中导入数据 - Python (1)

📅  最后修改于: 2023-12-03 15:37:25.417000             🧑  作者: Mango

在 Pandas 中导入数据 - Python

Pandas 是一种开源的数据分析工具库,用于处理和分析数据。它可以从各种数据源中导入数据,包括 CSV 文件、Microsoft Excel 文件、SQL 数据库等。本文将介绍如何在 Pandas 中导入数据。

导入 Pandas

要使用 Pandas 导入数据,首先需要安装并导入 Pandas 库。可以使用 pip 在命令行中安装 Pandas。

!pip install pandas

导入 Pandas 库的方法如下:

import pandas as pd
从 CSV 文件中导入数据

CSV 文件是一种常见的数据交换格式,通常使用逗号或分号来分隔各列数据。使用 Pandas 导入 CSV 文件非常简单,只需使用 pd.read_csv() 方法即可。

df = pd.read_csv('data.csv')

这里我们将从名为 data.csv 的 CSV 文件中导入数据。导入数据后,可以使用 head() 方法显示前几行数据。

print(df.head())
从 Microsoft Excel 文件中导入数据

除了 CSV 文件,Pandas 也支持从 Microsoft Excel 文件中导入数据。使用 Pandas 导入 Excel 文件需要安装 openpyxl 库,可以使用 pip 在命令行中安装 openpyxl 库。

!pip install openpyxl

使用 Pandas 导入 Excel 文件同样非常简单,只需使用 pd.read_excel() 方法即可。

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

这里我们将从名为 data.xlsx 的 Excel 文件中的名为 Sheet1 的工作表中导入数据。导入数据后,可以使用 head() 方法显示前几行数据。

print(df.head())
从 SQL 数据库中导入数据

Pandas 还支持从 SQL 数据库中导入数据。首先需要安装并导入 PyODBC 库,可以使用 pip 在命令行中安装 PyODBC 库。

!pip install pyodbc

使用 Pandas 导入 SQL 数据库需要首先建立一个数据库连接,然后使用 pd.read_sql() 方法导入数据。

import pyodbc

conn = pyodbc.connect('DRIVER={ODBC Driver for SQL Server};'
                      'SERVER=myserver.database.windows.net;'
                      'DATABASE=mydatabase;'
                      'UID=myusername;'
                      'PWD=mypassword')

df = pd.read_sql('SELECT * FROM mytable', conn)

这里我们将从名为 mytable 的表中导入数据。导入数据后,可以使用 head() 方法显示前几行数据。

print(df.head())
结论

以上就是在 Pandas 中导入数据的介绍。Pandas 不仅可以从 CSV 文件、Excel 文件和 SQL 数据库中导入数据,还支持从多种其他数据源中导入数据。掌握这些方法可以使数据分析工作更加高效和便捷。