熊猫 read_table()函数
Pandas 是分析数据、数据探索和操作最常用的软件包之一。在分析现实世界的数据时,我们经常使用 URL 来执行不同的操作,pandas 提供了多种方法来执行此操作。其中一种方法是read_table() 。
Parameters:
read_table(filepath_or_buffer, sep=False, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar='”‘, quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)
Returns: A comma(‘,’) separated values file(csv) is returned as two dimensional data with labelled axes.
要获取文章中使用的 csv 文件的链接,请单击此处。代码#1:显示文件的全部内容,列用“,”分隔
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',')
输出:
代码 #2:跳过没有索引的行
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',',skiprows=4,index_col=0)
输出:
在上面的代码中,跳过了四行,并显示了最后跳过的行。
代码 #3:使用索引跳过行
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',',skiprows=4)
输出:
代码#4:在大文件的情况下,如果您只想读取几行,则将所需的行数提供给nrows 。
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',',index_col=0,nrows=4)
输出:
代码 #5:如果您想从文件底部跳过行,则将所需的行数提供给skipfooter 。
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',',index_col=0,
engine='python',skipfooter=5)
输出:
代码 #6:用作列名的行号,数据的开头出现在header中给出的最后一个行号之后。
# importing pandas
import pandas as pd
pd.read_table('nba.csv',delimiter=',',index_col=0,header=[1,3,5])
输出: