Python 3.12 Std_Libs - String - 02 - 查找与替换

原创

已于 2026-05-11 21:14:28 修改 · 157 阅读

标签

#python #开发语言 #Python

于 2026-05-10 21:16:33 首次发布

开发板推荐：天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

点击查看

Python 3.12 Std_Libs - String - Find_Replace

字符串查找与替换是文本处理的核心任务，从简单的子串搜索到复杂的模板替换，Python 提供了丰富且高效的工具。本文将从内置 str 类型的查找与替换方法入手，深入分析其底层 CPython 实现原理，横向对比 string 模块中的模板替换机制，并对国际化字符串准备模块 stringprep 中的相关功能进行解析。最后通过多个实战示例，展示如何在不同场景下选择最合适的查找与替换方案，以达到性能与可读性的最佳平衡。

一、`str` 类型内置的查找方法

查找方法用于定位子串在字符串中的位置或统计出现次数。这些方法都是只读操作，不改变原字符串。它们大致可分为两类：返回索引的方法（find、rfind、index、rindex）和统计方法（count）。

1.1 `find()` 与 `rfind()` – 安全查找子串位置

find(sub[, start[, end]]) 返回子串 sub 在字符串中第一次出现的索引，若未找到则返回 -1。rfind() 从右侧开始查找最后一次出现的索引。

基本用法：

s = "hello world, hello python"
print(s.find("hello"))     # 0
print(s.rfind("hello"))    # 13
print(s.find("good"))      # -1

参数说明：

start 和 end 用于限制搜索范围（切片语义，左闭右开）。
支持负数索引，表示从末尾计数。

底层实现（CPython）：
find 和 rfind 底层调用 PyUnicode_Find 函数。该函数根据是否正向或反向选择使用 PyUnicode_FindChar 或 PyUnicode_Find。搜索算法采用快速 Two-Way 算法（Crochemore & Perrin）结合 Bloom Filter 优化，时间复杂度为 O(n)。对于单字符子串，会调用 memchr 等底层 C 函数加速。

设计细节：

对于空子串 ""，find 返回 start（或 0），这是因为空串被视为在任何位置都存在。这是符合直觉的。
性能：当字符串长度很大且子串较短时，Python 会启用内建优化，避免逐个字符扫描。

1.2 `index()` 与 `rindex()` – 查找失败时抛出异常

index() 与 find() 功能相同，但若子串不存在，则引发 ValueError。rindex() 对应 rfind()。

示例：

s = "hello world"
print(s.index("world"))   # 6
# print(s.index("good"))  # ValueError: substring not found

使用建议：当确信子串存在时用 index()，可避免多余的 -1 判断；否则用 find()。

底层：index 内部调用与 find 相同的查找函数，只是在返回 -1 时转换为异常。

1.3 `count()` – 统计子串出现次数

count(sub[, start[, end]]) 返回非重叠子串出现的次数。

示例：

s = "ababa"
print(s.count("aba"))   # 1 （重叠子串只计算一次）
print(s.count("ab"))    # 2

底层实现：与查找算法类似，使用 Two-Way 算法统计不重叠的匹配次数。

性能提示：

对于单字符统计，使用 s.count('a') 非常高效，因为内部会直接遍历字符。
若需统计多个字符的情况，可考虑使用

开发板推荐：天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

点击查看

最低0.47元/天解锁文章

Python 3.12 Std_Libs - String - 02 - 查找与替换

Python 3.12 Std_Libs - String - Find_Replace

一、str 类型内置的查找方法

1.1 find() 与 rfind() – 安全查找子串位置

1.2 index() 与 rindex() – 查找失败时抛出异常

1.3 count() – 统计子串出现次数

一、`str` 类型内置的查找方法

1.1 `find()` 与 `rfind()` – 安全查找子串位置

1.2 `index()` 与 `rindex()` – 查找失败时抛出异常

1.3 `count()` – 统计子串出现次数