📅  最后修改于: 2023-12-03 15:33:24.927000             🧑  作者: Mango
Pandas是Python中最流行的数据分析库之一,它提供了一种快速、灵活和方便的方式来读取不同格式的数据文件。本文将介绍如何使用Pandas读取常见的数据文件格式。
CSV(逗号分隔值)是一种常见的文件格式,它将数据按行存储,每个字段用逗号分隔。Pandas可以使用read_csv()方法轻松地读取CSV文件。
import pandas as pd
# 读取CSV文件
data = pd.read_csv('data.csv')
此时,数据文件必须位于当前工作目录中。如果文件位于其他位置,可以指定路径参数:
import pandas as pd
# 读取位于'D:/data/'目录下的CSV文件
data = pd.read_csv('D:/data/data.csv')
Pandas也可以轻松地读取Excel文件。可以使用read_excel()方法读取Excel文件。
import pandas as pd
# 读取Excel文件
data = pd.read_excel('data.xlsx')
可以使用sheet_name参数指定要读取的工作表名称:
import pandas as pd
# 读取Excel文件中名为'sheet_name'的工作表
data = pd.read_excel('data.xlsx', sheet_name='sheet_name')
JSON(JavaScript对象表示法)是一种常见的结构化数据格式,Pandas可以使用read_json()方法轻松地读取JSON文件。
import pandas as pd
# 读取JSON文件
data = pd.read_json('data.json')
Pandas还可以读取SQL数据库中的数据。可以使用read_sql()方法从SQL数据库中读取数据。
import pandas as pd
import sqlite3
# 连接到SQLite数据库
conn = sqlite3.connect('data.db')
# 读取SQL数据库中的数据
data = pd.read_sql('select * from table_name', conn)
可以使用不同的SQLAlchemy engine连接到不同类型的SQL数据库。
本文介绍了如何使用Pandas读取不同格式的数据文件。衷心希望本文能够帮助您更好地使用Pandas进行数据分析。