Python| Pandas Series.str.cat() 连接字符串
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas str.cat()用于将字符串连接到传递的调用者系列字符串 。可以传递来自不同系列的不同值,但两个系列的长度必须相同。 .str必须加上前缀以区别于 Python 的默认方法。
Syntax: Series.str.cat(others=None, sep=None, na_rep=None)
Parameters:
others: Series, index, data frame or list of strings to concatenate
sep: Separator to be put between the two strings
na_rep: None or string value to replace in place of null values
Return type: Series with concatenated string values
要下载使用的 Csv 文件,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
示例 #1:使用分隔符连接列
在此示例中,Team 列在 Name 列的末尾用分隔符“,”连接起来。名称列被新系列覆盖,然后显示数据框。
Python3
# importing pandas module
import pandas as pd
# importing csv from link
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# making copy of team column
new = data["Team"].copy()
# concatenating team with name column
# overwriting name column
data["Name"]= data["Name"].str.cat(new, sep =", ")
# display
data
Python3
# importing pandas module
import pandas as pd
# importing csv from link
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# making copy of team column
new = data["Team"].copy()
# string to replace null values with
na_string ="No College"
# concatenating team with name column
# overwriting name column
data["College"]= data["College"].str.cat(new, sep =", ", na_rep = na_string)
# display
data
输出:
如输出图像所示,Team 列中与 Name 列中的字符串具有相同索引的每个字符串都用分隔符“,”连接起来。
示例 #2:处理 Null 值
分析数据最重要的部分是处理空值。 str.cat() 提供了一种通过 na_rep 参数处理空值的方法。每次出现空值时,传递给此参数的任何内容都将被替换。
在此示例中,大学列与团队列连接。 “没有大学”被传递给 na_rep 参数以用这个字符串替换 null 。
Python3
# importing pandas module
import pandas as pd
# importing csv from link
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# making copy of team column
new = data["Team"].copy()
# string to replace null values with
na_string ="No College"
# concatenating team with name column
# overwriting name column
data["College"]= data["College"].str.cat(new, sep =", ", na_rep = na_string)
# display
data
输出:
从数据框中可以看出,在索引位置 4 和 5 处,有 NULL 值已被替换为“No College”,并且来自 Team 列的字符串已成功连接。