📜  使用 CSV 文件创建数据框

📅  最后修改于: 2022-05-13 01:54:43.230000             🧑  作者: Mango

使用 CSV 文件创建数据框

CSV文件是“逗号分隔值”,这些值用逗号分隔,这个文件可以像excel文件一样查看。在Python中,Pandas 是数据科学中最重要的库。我们在分析数据时需要处理庞大的数据集,通常可以得到 CSV 文件格式。可以通过多种方式使用 CSV 文件创建 pandas 数据框。
注意:从此处获取以下示例中使用的 csv 文件。
方法 #1:使用read_csv()方法: read_csv()是一个重要的 pandas函数,用于读取 csv 文件并对其进行操作。
示例

Python3
# Python program to illustrate
# creating a data frame using CSV files
 
# import pandas module
import pandas as pd
 
# creating a data frame
df = pd.read_csv("CardioGoodFitness.csv")
print(df.head())


Python3
# Python program to illustrate
# creating a data frame using CSV files
 
# import pandas module
import pandas as pd
 
# creating a data frame
df = pd.read_table("CardioGoodFitness.csv", delimiter =", ")
print(df.head())


Python3
# Python program to illustrate
# creating a data frame using CSV files
 
# import pandas module
import pandas as pd
# import csv module
import csv
 
with open("CardioGoodFitness.csv") as csv_file:
    # read the csv file
    csv_reader = csv.reader(csv_file)
 
    # now we can use this csv files into the pandas
    df = pd.DataFrame([csv_reader], index = None)
 
# iterating values of first column
for val in list(df[1]):
    print(val)


输出

csv-to-df-pandas

方法 #2:使用read_table()方法: read_table()是另一个重要的 pandas函数,用于读取 csv 文件并从中创建数据框。
示例

Python3

# Python program to illustrate
# creating a data frame using CSV files
 
# import pandas module
import pandas as pd
 
# creating a data frame
df = pd.read_table("CardioGoodFitness.csv", delimiter =", ")
print(df.head())

输出

csv-to-df-pandas

方法#3:使用csv模块:可以直接使用 csv 模块导入 csv 文件,然后使用该 csv 文件创建数据框。
示例

Python3

# Python program to illustrate
# creating a data frame using CSV files
 
# import pandas module
import pandas as pd
# import csv module
import csv
 
with open("CardioGoodFitness.csv") as csv_file:
    # read the csv file
    csv_reader = csv.reader(csv_file)
 
    # now we can use this csv files into the pandas
    df = pd.DataFrame([csv_reader], index = None)
 
# iterating values of first column
for val in list(df[1]):
    print(val)

输出

['TM195', '18', 'Male', '14', 'Single', '3', '4', '29562', '112']