一、文本检索

Python 正则表达式最主要的用途就是文本检索,它可以快速的查找满足特定模式的文本,比如查找某个单词或者某个关键字等。例如,如果想要查找一段文本中所有的数字,可以使用如下正则表达式:

import re
text = "This is a text with numbers: 1, 2, 3, 4, 5, 6"
pattern = re.compile(r'\d+')
matches = re.findall(pattern, text)
print(matches)
Python

运行结果:['1', '2', '3', '4', '5', '6']

二、文本替换

Python 正则表达式也可以用来替换文本,比如将一段文本中的某个单词替换成另一个单词。例如,要将一段文本中的“Python”替换成“Java”,可以使用如下正则表达式:

import re
text = "This is a text about Python"
pattern = re.compile(r'Python')
new_text = re.sub(pattern, 'Java', text)
print(new_text)
Python

运行结果:This is a text about Java

三、字符串分割

Python 正则表达式还可以用来分割字符串,比如将一个字符串按照空格分割成多个字符串。例如,要将一段文本按照空格分割成多个单词,可以使用如下正则表达式:

import re
text = "This is a text about Python"
pattern = re.compile(r'\s+')
words = re.split(pattern, text)
print(words)
Python

运行结果:['This', 'is', 'a', 'text', 'about', 'Python']