正则表达式概述

Python正则表达式(Regular Expression)是一种用来匹配字符串模式的工具,在处理文本数据时非常有用。Python中使用re模块来支持正则表达式的功能。

正则表达式基本语法

正则表达式由一组字符构成,这些字符有特殊的含义,可以用来匹配文本中的模式。

1. 字符匹配:

import re

pattern = "hello"
text = "hello world"

result = re.match(pattern, text)
if result:
    print("匹配成功")
else:
    print("匹配失败")

2. 元字符:

import re

pattern = "he..o"
text = "hello world"

result = re.match(pattern, text)
if result:
    print("匹配成功")
else:
    print("匹配失败")

3. 重复匹配:

import re

pattern = "he*o"
text = "hello world"

result = re.match(pattern, text)
if result:
    print("匹配成功")
else:
    print("匹配失败")

常用的正则表达式函数

Python提供了一些常用的正则表达式函数,用于处理字符串的匹配和替换。

1. re.match():从字符串的起始位置开始匹配,只匹配一次。

import re

pattern = "hello"
text = "hello world"

result = re.match(pattern, text)
if result:
    print("匹配成功")
else:
    print("匹配失败")

2. re.search():从字符串的任意位置开始匹配,只匹配一次。

import re

pattern = "hello"
text = "hello world"

result = re.search(pattern, text)
if result:
    print("匹配成功")
else:
    print("匹配失败")

3. re.findall():返回所有匹配的字符串列表。

import re

pattern = "o"
text = "hello world"

result = re.findall(pattern, text)
print(result)

4. re.sub():替换匹配的字符串。

import re

pattern = "o"
replace = "0"
text = "hello world"

result = re.sub(pattern, replace, text)
print(result)