Python| Pandas Series.str.rpartition()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas str.rpartition()
的工作方式与str.partition()
和str.split()
类似。 .rpartition()
不是在每次出现时从左侧拆分字符串,而是仅将字符串拆分一次并且反向拆分(从右侧)。与.split()
方法不同, rpartition()
方法也存储分隔符/定界符。
每次调用此方法之前都必须加上.str前缀,以将其与 Python 的默认函数区分开来,否则会引发错误。
注意:此方法与 str.partition() 方法不同,不是在第一次出现时拆分,而是在最后一次出现分隔符/分隔符时拆分字符串。
Syntax: Series.str.rpartition(pat=’ ‘, expand=True)
Parameters:
pat: String value, separator or delimiter to separate string at. Default is ‘ ‘ (whitespace)
expand: Boolean value, returns a data frame with different value in different columns if True. Else it returns a series with list of strings. Default is True.
Return type: Series of list or Data frame depending on expand Parameter
要下载代码中使用的 CSV,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
示例 #1:将字符串拆分为列表
在此示例中,团队列在最后一次出现“o”时被拆分为列表。在执行任何操作之前,使用 .dropna() 方法删除空行以避免错误。
Python3
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# splitting and overwriting column
data["Team"]= data["Team"].str.rpartition("o", False)
# display
data
Python3
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# splitting and overwriting column
df = data["Name"].str.rpartition("a", True)
# display
df
输出:
如输出图像所示,字符串“波士顿凯尔特人队”在最后一次出现“o”时被分开。返回的列表也有分隔符。
示例 #2:将字符串拆分为数据框
在此示例中,通过保持展开参数为真,在“a”的最后一次出现(右侧第一个)时将名称列拆分为数据框。在执行任何操作之前,使用 .dropna() 方法删除空行以避免错误。
Python3
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# splitting and overwriting column
df = data["Name"].str.rpartition("a", True)
# display
df
输出:
如输出图像所示,字符串在字符串中最后一次出现 'a' 时被拆分为数据帧。
注意:如果字符串中没有出现分隔符,则整个字符串存储在数据框的最后一列/列表的最后一个索引中。