📜  读取 tsv 文件列 - Python (1)

📅  最后修改于: 2023-12-03 15:41:47.302000             🧑  作者: Mango

读取 tsv 文件列 - Python

在 Python 中,我们可以使用 pandas 模块读取和操作 tsv 文件。下面是一些常用的代码片段,用于读取单个列或多个列。

首先,让我们创建一个示例 tsv 文件,其中包含姓名、年龄和性别列:

姓名    年龄    性别
Amy     24      女
Bob     32      男
Cathy   28      女
Dan     45      男
读取单个列

要读取单个列中的数据,请使用 pandas 中的 read_csv 函数,并指定要读取的列名称。例如,要读取 '年龄' 列中的所有数据,可以使用以下代码:

import pandas as pd

# 读取 tsv 文件
df = pd.read_csv('example.tsv', delimiter='\t')

# 读取单个列数据
age = df['年龄']

# 打印年龄列数据
print(age)

这将输出以下内容:

0    24
1    32
2    28
3    45
Name: 年龄, dtype: int64

请注意,我们需要使用 '\t' 作为分隔符,因为这是一个 tsv 文件。默认情况下,read_csv 函数使用逗号 ',' 作为分隔符。

读取多个列

要读取多个列中的数据,请指定要读取的列名称列表。例如,要读取 '姓名' 和 '性别' 列的数据,可以使用以下代码:

import pandas as pd

# 读取 tsv 文件
df = pd.read_csv('example.tsv', delimiter='\t')

# 读取多个列数据
name_gender = df[['姓名', '性别']]

# 打印姓名和性别列数据
print(name_gender)

这将输出以下内容:

     姓名 性别
0    Amy  女
1    Bob  男
2  Cathy  女
3    Dan  男

请注意,我们使用一个包含所需列名称的列表作为索引器,以便从 DataFrame 中选择多列。

这就是 Python 中使用 pandas 读取 tsv 文件列的方式。使用这些方法,您可以轻松地操作和分析大型数据集中的列数据。