📜  Python|熊猫系列.str.len()

📅  最后修改于: 2022-05-13 01:55:39.047000             🧑  作者: Mango

Python|熊猫系列.str.len()

Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。

Pandas str.len()方法用于确定 Pandas 系列中每个字符串的长度。此方法仅适用于字符串系列。
由于这是一个字符串方法,因此每次调用此方法之前都必须加上 .str前缀。否则会报错。

要下载代码中使用的 CSV,请单击此处。在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。

示例 #1:计算字符串系列的长度(dtype=str)

在本例中,Name 列的字符串长度是使用 str.len() 方法计算的。 Series 的 dtype 已经是字符串。所以不需要数据类型转换。在执行任何操作之前,将删除空行以避免错误。

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# creating new column for len
# passing values through str.len()
data["Name Length"]= data["Name"].str.len()
  
# display
data

输出:
如输出图像所示,返回 name 列中每个字符串的长度。

笔记:

  • 此方法不计算整数或浮点系列的长度。由于它不是字符串系列,因此会出错。该系列需要先转换(在下一个示例中显示)

  • 没有处理空值的参数。空值也会在输出字符串中返回空值。


示例 #2:
在这个例子中,salary 列的长度是使用 str.len() 方法计算的。由于该系列是作为 float64 dtype 导入的,因此首先使用 .astype() 方法将其转换为字符串。

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# converting to string dtype
data["Salary"]= data["Salary"].astype(str)
  
# passing values
data["Salary Length"]= data["Salary"].str.len()
  
# converting back to float dtype
data["Salary"]= data["Salary"].astype(float)
  
# display
data

输出:
如输出所示,int 或 float 系列的长度只能通过将其转换为字符串dtype 来计算。