在Python中使用 Regex 将 10 位电话号码转换为美国格式
文本预处理是自然语言处理中最重要的任务之一。您可能想从字符串中提取数字。为这样的处理任务编写手动脚本需要付出很多努力,而且大多数时候容易出错。考虑到这些预处理任务的重要性,正则表达式的概念已经在不同的编程语言中得到发展,以简化这些文本处理任务。
要实现正则表达式,可以使用Python re包,并且可以像任何其他内置Python模块一样轻松导入使用它。
将 10 位电话号码转换为其对应的美国号码格式的步骤:
- 导入Python re包。
- 编写一个函数,将要格式化的电话号码作为参数并对其进行处理。
- 现在只需调用函数并传递值。
例子:
Python3
import re
def convert_phone_number(phone):
# actual pattern which only change this line
num = re.sub(r'(?
输出:
Call geek (321) 963-0612