from __future__ import print_function
from __future__ import division
from __future__ import absolute_import
import re
text = "天安门:我爱北京天安门,因为北京天安门很漂亮"
text_1 = "我爱北京天安门,因为北京天安门很漂亮"
res_match = re.match("天安门", text)
res_match_1 = re.match("天安门", text_1)
print(res_match)
print(res_match.group())
print(res_match.span())
# match只匹配开头字符串,并且只匹配一次,返回的数据类型是 <class '_sre.SRE_Match'>
# 可调用group获得匹配的内容,调用span获得匹配的开始结束位置
##########
res_search = re.search("天安门", text)
res_search_1 = re.search("天安门", text_1)
print(res_search)
print(res_search.group())
print(res_search.span())
# search匹配字符串任何位置,并且只匹配一次,返回的数据类型是 <class '_sre.SRE_Match'>
# 可调用group获得匹配的内容,调用span获得匹配的开始结束位置
##########
res_findall = re.findall("天安门", text)
print(res_findall)
# findall匹配字符串任何位置,匹配多次,返回的数据类型是list,仅仅包含匹配到的字符串内容
运行结果:
<_sre.SRE_Match object; span=(0, 3), match='天安门'>
天安门
(0, 3)
<_sre.SRE_Match object; span=(0, 3), match='天安门'>
天安门
(0, 3)
['天安门', '天安门', '天安门']
本文通过示例展示了Python中`re.match()`、`re.search()`和`re.findall()`函数在文本处理中的使用,讲解了它们的区别以及如何获取匹配的内容和位置。重点讨论了如何从文本中提取特定字符串。

483

被折叠的 条评论
为什么被折叠?



