处理文本数据,尤其是关键词当匹配,python正则匹配真是最常用,没有之一的玩法了。而正则匹配也并没有想想中的那样难,不要被吓到。本质就是许多通配符,记不得没关系,会查表使用就OK了。
split( )函数:用于根据特定的字符、字符串分隔原字符串
举个例子,有字符串des['description'][0],值如下所示:

对该字符串进行分隔,分隔符是“车联网”。使用代码:
des['descritions'][0].split('车联网')
结果就是这样了,“车联网”作为分隔符像逗号分隔符一样,被分列后就没了

findall( )函数:返回所有匹配到的关键字
同样是刚才的des['descritions'][0],findall( )用于检索关键词后给词条打标签最好了,它的功能是将所有命中的keywords都返回,返回值是一个list。

本文介绍了Python正则表达式中findall()函数的使用,包括如何进行文本数据处理,如何分隔字符串,以及如何通过findall()检索关键字并返回所有匹配项。示例展示了结合re.compile()使用正则表达式的场景,帮助读者掌握findall()的基本操作。

1244

被折叠的 条评论
为什么被折叠?



