📜  Python|熊猫系列.sample()

📅  最后修改于: 2022-05-13 01:55:44.792000             🧑  作者: Mango

Python|熊猫系列.sample()

Pandas 系列是带有轴标签的一维 ndarray。标签不必是唯一的,但必须是可散列的类型。该对象支持基于整数和基于标签的索引,并提供了许多用于执行涉及索引的操作的方法。

Pandas Series.sample()函数从对象轴返回项目的随机样本。我们还可以使用 random_state 来实现可重复性。

示例 #1:使用Series.sample()函数从给定的 Series 对象中抽取随机值样本。

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series(['New York', 'Chicago', 'Toronto', 'Lisbon', 'Rio', 'Moscow'])
  
# Create the Datetime Index
index_ = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5', 'City 6']
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

输出 :

现在我们将使用Series.sample()函数从给定的 Series 对象中抽取随机值样本。

# Draw random sample of 3 values
selected_cities = sr.sample(n = 3)
  
# Print the returned Series object
print(selected_cities)

输出 :

正如我们在输出中看到的, Series.sample()函数成功地从给定的 Series 对象中返回了 3 个值的随机样本。示例 #2:使用Series.sample()函数从给定的 Series 对象中抽取随机值样本。

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series([100, 25, 32, 118, 24, 65])
  
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

输出 :

现在我们将使用Series.sample()函数来选择一个大小等于给定 Series 对象大小的 25% 的随机样本。

# Draw random sample of size of 25 % of the original object
selected_items = sr.sample(frac = 0.25)
  
# Print the returned Series object
print(selected_items)

输出 :

正如我们在输出中看到的, Series.sample()函数成功地从给定的 Series 对象中返回了 2 个值的随机样本,这是原始系列对象大小的 25%。