📜  Python写CSV文件

📅  最后修改于: 2020-10-28 00:58:52             🧑  作者: Mango

Python写入CSV文件

CSV文件

CSV代表“逗号分隔的值”,它定义为一种简单的文件格式,使用特定的结构来排列表格数据。它以纯文本格式存储表格数据,例如电子表格或数据库,并具有用于数据交换的标准格式。 CSV文件将打开到excel工作表中,并且行和列数据定义标准格式。

Python CSV模块功能

CSV模块的工作是处理CSV文件以从指定列读取/写入和获取数据。 CSV函数有不同类型,如下所示:

  • csv.field_size_limit-返回解析器允许的当前最大字段大小。
  • csv.get_dialect-返回与名称关联的方言。
  • csv.list_dialects-返回所有已注册方言的名称。
  • csv.reader-从CSV文件读取数据
  • csv.register_dialect-它将方言与名称相关联,并且名称必须是字符串或Unicode对象。
  • csv.writer-将数据写入CSV文件
  • csv.unregister_dialect-从方言注册表中删除与名称相关联的方言。如果名称不是注册的方言名称,则将引发错误。
  • csv.QUOTE_ALL-它指示编写器对象引用所有字段。
  • csv.QUOTE_MINIMAL-它指示编写器对象仅引用那些包含特殊字符(如quotechar,delimiter等)的字段。
  • csv.QUOTE_NONNUMERIC-它指示编写器对象引用所有非数字字段。
  • csv.QUOTE_NONE-它指示writer对象不要引用字段。

编写CSV文件

我们还可以使用csv.writer()模块在Python编写任何新的和现有的CSV文件。它类似于csv.reader()模块,还具有两种方法,即writer函数或Dict Writer类。

它提供了两个函数,即writerow()和writerows()。该writerow()函数只写一行,并writerows()函数写多行。方言

它被定义为一种允许您创建,存储和重用各种格式设置参数的构造。它支持几种属性;最常用的是:

  • Dialect.delimiter:此属性用作字段之间的分隔字符。默认值为逗号(,)。
  • Dialect.quotechar:此属性用于引用包含特殊字符的字段。
  • Dialect.lineterminator:用于创建新行,默认值为’\ r \ n’。

让我们将以下数据写入CSV文件。

data = [{'Rank': 'B', 'first_name': 'Parker', 'last_name': 'Brian'},   
{'Rank': 'A', 'first_name': 'Smith', 'last_name': 'Rodriguez'},  
{'Rank': 'C', 'first_name': 'Tom', 'last_name': 'smith'},  
{'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'},   
{'Rank': 'A', 'first_name': 'Alex', 'last_name': 'Tim'}]  

范例-

import csv  
   
with open('Python.csv', 'w') as csvfile:  
    fieldnames = ['first_name', 'last_name', 'Rank']  
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)  
   
    writer.writeheader()  
    writer.writerow({'Rank': 'B', 'first_name': 'Parker', 'last_name': 'Brian'})  
    writer.writerow({'Rank': 'A', 'first_name': 'Smith',  
                     'last_name': 'Rodriguez'})  
    writer.writerow({'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'})  
    writer.writerow({'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Loive'})  
   
print("Writing complete")  

输出:

Writing complete

它返回名为“Python.csv”的文件,其中包含以下数据:

first_name,last_name,Rank  
Parker,Brian,B  
Smith,Rodriguez,A  
Jane,Oscar,B  
Jane,Loive,B   

将CSV写入字典

我们还可以使用DictWriter类将CSV文件直接写入字典中。

名为Python.csv的文件包含以下数据:

范例-

import csv  
with open('python.csv', mode='w') as csv_file:  
    fieldnames = ['emp_name', 'dept', 'birth_month']  
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames)  
    writer.writeheader()  
    writer.writerow({'emp_name': 'Parker', 'dept': 'Accounting', 'birth_month': 'November'})  
    writer.writerow({'emp_name': 'Smith', 'dept': 'IT', 'birth_month': 'October'})  

输出:

emp_name,dept,birth_month
Parker,Accounting,November
Smith,IT,October

使用Pandas写CSV文件

Pandas被定义为在Numpy库顶部构建的开源库。它为用户提供快速分析,数据清理和数据准备。

就像使用熊猫读取CSV文件一样简单。您需要创建DataFrame,它是一个二维的异构表格数据结构,由三个主要组件组成:数据,列和行。在这里,我们读取一个稍微复杂的文件hrdata.csv,其中包含公司员工的数据。

Name,Hire Date,Salary,Leaves Remaining  
John Idle,08/15/14,50000.00,10  
Smith Gilliam,04/07/15,65000.00,8  
Parker Chapman,02/21/14,45000.00,10  
Jones Palin,10/14/13,70000.00,3  
Terry Gilliam,07/22/14,48000.00,7  
Michael Palin,06/28/13,66000.00,8  

范例-

import pandas  
df = pandas.read_csv('hrdata.csv',   
            index_col='Employee',   
            parse_dates=['Hired'],  
            header=0,   
            names=['Employee', 'Hired', 'Salary', 'Sick Days'])  
df.to_csv('hrdata_modified.csv')  

输出:

Employee, Hired, Salary, Sick Days
John Idle, 2014-03-15, 50000.0,10
Smith Gilliam, 2015-06-01, 65000.0,8
Parker Chapman, 2014-05-12, 45000.0,10
Jones Palin, 2013-11-01, 70000.0,3
Terry Gilliam, 2014-08-12 , 48000.0,7
Michael Palin, 2013-05-23, 66000.0,8