熊猫头尾样本的区别
先决条件:对 Pandas 的基本了解
在本文中,我们将看到使用Python的 Pandas Head、Tail 和 Sample 之间的区别
Pandas 是一个开源库,主要用于轻松直观地处理关系或标记数据。它提供了用于操作数值数据和时间序列的各种数据结构和操作。读取 CSV 文件后的第一行代码是显示给定数据集的数据。 Pandas 提供了三个这样的功能,您可以通过它们显示示例数据集。三个这样的方法是 Head、Tail 和 Sample。
头部、尾部和样本之间的差异
必须分析他们应该如何显示给定的数据。通常,许多程序员更喜欢选择 head() 并检查起始行来分析数据。但有时可能还不够。我说使用所有三个来分析数据。
样本
使用 Sample 方法,您可以显示数据集中的随机数据。您可以通过不同的方式显示数据集中的样本数据。
例子:
Python
import pandas as pd
data = {
"Anime": ["One Piece", "Naruto", "Bleach",
"Hunter X Hunter", "Attack On Titan",
"Gintama", "Code Geass", "Death Note",
"Black Lagoon", "Classroom Of Elite",
"Cowboy Bepop", "Jujutsu Kaisen",
"Blue Period"],
"Episodes": [1009, 720, 366, 148, 74, 366,
50, 37, 24, 12, 26, 24, 12],
"Year": [1999, 2002, 2004, 2011, 2013, 2006,
2007, 2008, 2006, 2016, 1995,
2020, 2021]
}
df = pd.DataFrame(data)
Python3
print(df.sample()) # just one row
print(df.sample(6)) # randomly selected 6 row
Python3
print(df.head()) # default:5 rows
print(df.head(8)) # first 8 ordered rows
Python3
print(df.tail()) # default:5 rows
print(df.tail(8)) # last 8 ordered rows
现在我们有了数据,尝试使用示例方法查看数据。
Syntax:
df.sample() #returns only one row
df.sample(n) #returns n number of row
Python3
print(df.sample()) # just one row
print(df.sample(6)) # randomly selected 6 row
输出:
请注意,样本返回无序的随机数据。
头
作为简单的英文意思,Head 用于表示身体的上半部分。在 Pandas 中,head 用于从顶部显示有序数据。在传递空参数时,默认情况下,它显示前 5 行。通过提供“n”值,您甚至可以显示 n 个数据。
Syntax:
df.head() #default=5 Rows
df.head(n) #n number of rows
Python3
print(df.head()) # default:5 rows
print(df.head(8)) # first 8 ordered rows
输出:
尾巴
尾巴与头部相对。它从下面显示有序数据。
Syntax:
df.tail() #default 5 number of rows
df.tail(n) #n number of rows
Python3
print(df.tail()) # default:5 rows
print(df.tail(8)) # last 8 ordered rows
输出:
结论
样本、头部和尾部之间的主要区别在于:在传递空参数时,样本只返回一行,而头部和尾部返回 5 行。样本返回无序数据,而头部和尾部返回有序数据。