📅  最后修改于: 2023-12-03 15:37:25.417000             🧑  作者: Mango
Pandas 是一种开源的数据分析工具库,用于处理和分析数据。它可以从各种数据源中导入数据,包括 CSV 文件、Microsoft Excel 文件、SQL 数据库等。本文将介绍如何在 Pandas 中导入数据。
要使用 Pandas 导入数据,首先需要安装并导入 Pandas 库。可以使用 pip 在命令行中安装 Pandas。
!pip install pandas
导入 Pandas 库的方法如下:
import pandas as pd
CSV 文件是一种常见的数据交换格式,通常使用逗号或分号来分隔各列数据。使用 Pandas 导入 CSV 文件非常简单,只需使用 pd.read_csv()
方法即可。
df = pd.read_csv('data.csv')
这里我们将从名为 data.csv
的 CSV 文件中导入数据。导入数据后,可以使用 head()
方法显示前几行数据。
print(df.head())
除了 CSV 文件,Pandas 也支持从 Microsoft Excel 文件中导入数据。使用 Pandas 导入 Excel 文件需要安装 openpyxl 库,可以使用 pip 在命令行中安装 openpyxl 库。
!pip install openpyxl
使用 Pandas 导入 Excel 文件同样非常简单,只需使用 pd.read_excel()
方法即可。
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
这里我们将从名为 data.xlsx
的 Excel 文件中的名为 Sheet1
的工作表中导入数据。导入数据后,可以使用 head()
方法显示前几行数据。
print(df.head())
Pandas 还支持从 SQL 数据库中导入数据。首先需要安装并导入 PyODBC 库,可以使用 pip 在命令行中安装 PyODBC 库。
!pip install pyodbc
使用 Pandas 导入 SQL 数据库需要首先建立一个数据库连接,然后使用 pd.read_sql()
方法导入数据。
import pyodbc
conn = pyodbc.connect('DRIVER={ODBC Driver for SQL Server};'
'SERVER=myserver.database.windows.net;'
'DATABASE=mydatabase;'
'UID=myusername;'
'PWD=mypassword')
df = pd.read_sql('SELECT * FROM mytable', conn)
这里我们将从名为 mytable
的表中导入数据。导入数据后,可以使用 head()
方法显示前几行数据。
print(df.head())
以上就是在 Pandas 中导入数据的介绍。Pandas 不仅可以从 CSV 文件、Excel 文件和 SQL 数据库中导入数据,还支持从多种其他数据源中导入数据。掌握这些方法可以使数据分析工作更加高效和便捷。