📜  Python Pandas-IO工具(1)

📅  最后修改于: 2023-12-03 15:04:07.237000             🧑  作者: Mango

Python Pandas-IO工具

简介

Pandas是Python常用的数据分析与处理工具,它的IO工具可用于读取和写入各种不同的数据格式,包括csv、Excel、SQL等格式。在本文中,我们将深入介绍Pandas的IO工具的用法和示例。

读取csv文件

使用Pandas的read_csv函数来读取csv文件。

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())

在上面的示例中,read_csv函数被用来读取名为“data.csv”的文件。读取成功后,我们打印了前五行数据。

写入csv文件

使用Pandas的to_csv函数来写入csv文件。

import pandas as pd

df = pd.DataFrame({'name': ['John', 'Mike', 'Sally'],
                   'age': [30, 25, 40],
                   'city': ['New York', 'Chicago', 'Los Angeles']})

df.to_csv('output.csv', index=False)

在上面的示例中,我们先创建了一个DataFrame,然后使用to_csv函数将其写入名为“output.csv”的文件中。注意,我们在to_csv函数中指定了“index=False”,它将使得文件中不会保留DataFrame的索引列。

读取Excel文件

使用Pandas的read_excel函数来读取Excel文件。

import pandas as pd

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
print(df.head())

在上面的示例中,read_excel函数被用来读取名为“data.xlsx”的文件和名为“Sheet1”的工作表。读取成功后,我们打印了前五行数据。

写入Excel文件

使用Pandas的to_excel函数来写入Excel文件。

import pandas as pd

df = pd.DataFrame({'name': ['John', 'Mike', 'Sally'],
                   'age': [30, 25, 40],
                   'city': ['New York', 'Chicago', 'Los Angeles']})

df.to_excel('output.xlsx', index=False, sheet_name='Sheet1')

在上面的示例中,我们先创建了一个DataFrame,然后使用to_excel函数将其写入名为“output.xlsx”的文件和名为“Sheet1”的工作表中。注意,我们在to_excel函数中指定了“index=False”,它将使得工作表中不会保留DataFrame的索引列。

读取SQL数据库

使用Pandas的read_sql函数来读取SQL数据库。

import pandas as pd
import sqlite3

conn = sqlite3.connect('data.db')
df = pd.read_sql('SELECT * FROM employees', conn)
print(df.head())

在上面的示例中,我们首先使用Python的sqlite3模块连接到名为“data.db”的SQL数据库,然后使用read_sql函数从名为“employees”的表中读取所有数据。读取成功后,我们打印了前五行数据。

写入SQL数据库

使用Pandas的to_sql函数来写入SQL数据库。

import pandas as pd
import sqlite3

df = pd.DataFrame({'name': ['John', 'Mike', 'Sally'],
                   'age': [30, 25, 40],
                   'city': ['New York', 'Chicago', 'Los Angeles']})

conn = sqlite3.connect('data.db')
df.to_sql('employees', conn, index=False, if_exists='replace')

在上面的示例中,我们先创建了一个DataFrame,然后使用to_sql函数将其写入名为“data.db”的SQL数据库中的名为“employees”的表中。注意,我们在to_sql函数中指定了“index=False”和“if_exists='replace'”,它们将使得表中不会保留DataFrame的索引列并且如果表已经存在,它将被替换。