Python| Pandas Series.str.count()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas str.count()
方法用于计算字符串或正则表达式模式在系列的每个字符串中的出现次数。额外的标志参数也可以传递给处理来修改正则表达式的某些方面,如区分大小写、多行匹配等。
由于这是一个 pandas字符串方法,它仅适用于字符串系列,并且每次调用此方法之前都必须加上.str前缀。否则会报错。
Syntax: Series.str.count(pat, flags=0)
Parameters:
pat: String or regex to be searched in the strings present in series
flags: Regex flags that can be passed (A, S, L, M, I, X), default is 0 which means None. For this regex module (re) has to be imported too.
Return type: Series with count of occurrence of passed characters in each string.
要下载代码中使用的 CSV,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
示例 #1:计算单词出现次数
在这个例子中,一个 Pandas 系列是由一个列表组成的,并使用 str.count() 方法计算 gfg 的出现。
# importing pandas package
import pandas as pd
# making list
list =["GeeksforGeeks", "Geeksforgeeks", "geeksforgeeks",
"geeksforgeeks is a great platform", "for tech geeks"]
# making series
series = pd.Series(list)
# counting occurrence of geeks
count = series.str.count("geeks")
# display
count
输出:
如输出图像所示,显示了每个字符串中极客的出现次数,并且由于第一个大写字母,极客没有被计算在内。
示例 #2:使用标志
在此示例中,“a”的出现计数在 Name 列中。也使用了flag参数并将re.I传递给它,这意味着IGNORECASE。因此,在计数期间将考虑 a 和 A。
# importing pandas module
import pandas as pd
# importing module for regex
import re
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# String to be searched in start of string
search ="a"
# count of occurrence of a and creating new column
data["count"]= data["Name"].str.count(search, re.I)
# display
data
输出:
如输出图像所示,通过查看第一个索引本身可以清楚地比较它,Avery Bradely 中 a 的计数为 2,这意味着同时考虑了大写和小写。