Python中 Pandas 的 read_csv()函数中使用 na_values 参数
read_csv()是读取 CSV 文件的重要 pandas函数。但是还有很多其他的事情可以通过这个函数做,只是为了完全改变返回的对象。在这篇文章中,我们将看到 na_values 参数的使用。
na_values:用于创建将 pandas 视为 NaN(非数字)的字符串。默认情况下,熊猫将 #N/A、-NaN、-n/a、N/A、NULL 等视为 NaN 值。让我们看一下示例以便更好地理解。
所以这是我们的数据框,它具有三个列名、类和总分。现在在Python pandas 中导入数据框。
请参阅此处使用的数据集的链接。
示例 1:请参阅 pandas 将 #N/A 视为 NaN。
Python3
# import pandas library
import pandas as pd
# read a csv file
df = pd.read_csv('Example.csv')
# show the dataframe
print(df)
Python3
# import pandas library
import pandas as pd
# read a csv file
df = pd.read_csv('Example.csv',
na_values = "not available")
# show the dataframe
print(df)
输出:
示例 2:现在使用na_values参数告诉 pandas 他们认为“不可用”为 NaN 值,并在“不可用”的位置打印 NaN。
Python3
# import pandas library
import pandas as pd
# read a csv file
df = pd.read_csv('Example.csv',
na_values = "not available")
# show the dataframe
print(df)
输出: