📜  Python|熊猫系列.str.pad()

📅  最后修改于: 2022-05-13 01:54:44.254000             🧑  作者: Mango

Python|熊猫系列.str.pad()

Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。

Pandas 提供了一种为系列中的每个字符串元素添加填充(空格或其他字符)的方法。每次调用此方法之前都必须加上.str前缀,以将其与 Python 的默认函数区分开来,否则会抛出错误。

要下载代码中使用的 CSV,请单击此处。

在以下示例中,使用的数据框包含一些 NBA 球员的数据。 str.pad()方法将用于向文本添加填充。任何操作之前的数据帧图像如下所示:

示例 #1:左侧填充

在此示例中,字符串的最小长度设置为 15,并使用str.pad()方法将空格添加到 Team 列中字符串的左侧。由于看不到空格,因此将它们与自定义输入字符串进行比较,并检查结果是否为真,仅适用于球队名称“波士顿凯尔特人队”。

# importing pandas module
import pandas as pd
  
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/upload/nba.csv")
  
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
  
# adding white spaces to left side
data["Team"]= data["Team"].str.pad(15, side ='left')
  
# custom string
string =' Boston Celtics'
  
# checking if same or not
data["Team"]== string

输出:
如输出图像所示,对于球队名称 Boston Celtics,条件为 True,这意味着空间已成功添加。类似地,其他字符串也根据它们的长度进行填充。


示例 #2:右填充

在此示例中,字符串的最小长度设置为 15,并使用 str.pad() 方法将“_”添加到 Team 列中字符串的右侧。 '_' 被传递给 fillchar 参数以添加它而不是默认空格。

# importing pandas module
import pandas as pd
  
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
  
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
  
# adding white spaces to left side
data["Team"]= data["Team"].str.pad(15, side ='right', fillchar ='_')
  
# output display
data

输出:
如输出图像所示,“_”已根据字符串的长度添加到字符串的右侧。填充后,每个字符串的长度为 15。


示例 3:两侧填充

在此示例中,使用 str.pad() 中的 fillchar 参数将“+”添加到字符串的两侧。 width 参数设置为 20,这样每个字符串在 padding 后的长度都相同。

# importing pandas module
import pandas as pd
  
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
  
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
  
# adding white spaces to left side
data["Name"]= data["Name"].str.pad(20, side ='both', fillchar ='+')
  
# output
data

输出:
如输出图像所示,“+”被添加到字符串的两侧。每个字符串中“+”号的数量可能不同,但填充后每个字符串的长度为 20。

注意:从图中可以看出,如果字符串左侧有奇数个位置(宽度 - 长度),则优先考虑右侧。因此,左侧的一个字符将被添加到右侧。

与名称列的第一行一样,字符串的长度为 13。因此 20-13 = 7。因此左侧添加了 3 个“+”,右侧添加了“4”。