Python|熊猫系列.sample()
Pandas 系列是带有轴标签的一维 ndarray。标签不必是唯一的,但必须是可散列的类型。该对象支持基于整数和基于标签的索引,并提供了许多用于执行涉及索引的操作的方法。
Pandas Series.sample()
函数从对象轴返回项目的随机样本。我们还可以使用 random_state 来实现可重复性。
Syntax: Series.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
Parameter :
n : Number of items from axis to return.
frac : Fraction of axis items to return.
replace : Sample with or without replacement.
weights : Default ‘None’ results in equal probability weighting.
random_state : Seed for the random number generator (if int), or numpy RandomState object.
axis : Axis to sample.
Returns : Series or DataFrame
示例 #1:使用Series.sample()
函数从给定的 Series 对象中抽取随机值样本。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series(['New York', 'Chicago', 'Toronto', 'Lisbon', 'Rio', 'Moscow'])
# Create the Datetime Index
index_ = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5', 'City 6']
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.sample()
函数从给定的 Series 对象中抽取随机值样本。
# Draw random sample of 3 values
selected_cities = sr.sample(n = 3)
# Print the returned Series object
print(selected_cities)
输出 :
正如我们在输出中看到的, Series.sample()
函数成功地从给定的 Series 对象中返回了 3 个值的随机样本。示例 #2:使用Series.sample()
函数从给定的 Series 对象中抽取随机值样本。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([100, 25, 32, 118, 24, 65])
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.sample()
函数来选择一个大小等于给定 Series 对象大小的 25% 的随机样本。
# Draw random sample of size of 25 % of the original object
selected_items = sr.sample(frac = 0.25)
# Print the returned Series object
print(selected_items)
输出 :
正如我们在输出中看到的, Series.sample()
函数成功地从给定的 Series 对象中返回了 2 个值的随机样本,这是原始系列对象大小的 25%。