📅  最后修改于: 2023-12-03 15:07:26.284000             🧑  作者: Mango
当我们需要获取大量数据的一部分时,有时只需获取前几列是足够的。这种情况下,使用pandas库可以轻松地实现这个任务。
下面是如何从一个数据集中只获取前10列的例子。
首先,我们需要导入pandas库,并且使用read_csv函数从CSV文件读取数据。
import pandas as pd
df = pd.read_csv('data.csv')
现在,我们只需要使用iloc
函数选择前10列即可。
df = df.iloc[:, :10]
以上代码将使用iloc函数,只选择数据集中的前10列,并将结果存储在df变量中。
最后,我们可以使用head
函数来查看数据集的前几行。
print(df.head())
输出:
col1 col2 col3 col4 col5 col6 col7 col8 col9 col10
0 1 4 1 5 4 5 1 5 4 5
1 0 5 2 1 2 3 3 3 3 3
2 1 5 4 0 0 5 2 2 2 1
3 2 1 0 2 2 3 3 3 3 3
4 3 3 3 3 3 2 2 2 2 2
现在我们已经成功地从数据集中只选择了前10列。