Python| Pandas Series.str.wrap()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas str.wrap()
是处理长文本数据(段落或消息)时的重要方法。这用于在超过传递的宽度时将长文本数据分配到新行或处理制表符空格。由于这是一个字符串方法,因此每次调用此方法之前都必须加上 .str前缀。
Syntax: Series.str.wrap(width, **kwargs)
Parameters:
width: Integer value, defines maximum line width
**kwargs[Optional parameters]
expand_tabs: Boolean value, expands tab characters to spaces if True
replace_whitespace: Boolean value, if true, each white space character is replaced by single white space.
drop_whitespace: Boolean value, If true, removes whitespace if any at the beginning of new lines
break_long_words: Boolean value, if True, breaks word that are longer than the passed width.
break_on_hyphens: Boolean value, if true, breaks string on hyphens where string length is less than width.
Return type: Series with splitted lines/added characters(‘\n’)
要下载代码中使用的数据集,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
例子 :
在此示例中,Team 列以 5 个字符的行宽进行换行。因此 \n 将放在每 5 个字符之后。打印来自新团队列和旧团队列的随机元素以查看工作情况。在应用任何操作之前,使用.dropna()
方法删除空元素。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# display
data["New Team"]= data["Team"].str.wrap(5)
# data frame display
data
# printing same index separately
print(data["Team"][120])
print("------------")
print(data["New Team"][120])
输出:
如输出图像所示,New 列每 5 个字符后有 '\n' 。打印新旧团队列的相同索引后,可以看到在打印语句中没有添加字符, Python自动读取字符串中的'\n'并将其放入新行中。
带有新团队列的数据框-
输出:
Los Angeles Lakers
------------
Los A
ngele
s Lak
ers