在python 3中查找字符串中单词的出现

拖曳声纳 • 2022-12-16 • 随笔 • 阅读 35

如果您要提高效率：

import recount = sum(1 for _ in re.finditer(r'b%sb' % re.escape(word), input_string))

这不需要创建任何中间列表（与不同

split()

），因此可以有效地处理较大的

input_string

值。

它还具有正确使用标点符号的好处-它将正确返回

为短语的计数

"Mike saw adog."

（而无参数的则

split()

不会）。它使用

正则表达式标志，该标志在单词边界（

aka

[a-zA-Z0-9_]

和其他任何东西之间的转换）上匹配。

如果您需要担心ASCII字符集以外的语言，则可能需要调整正则表达式以正确匹配那些语言中的非单词字符，但是对于许多应用程序来说，这可能会过于复杂，在许多其他情况下，设置unipre和/或正则表达式的区域设置标志就足够了。

欢迎分享，转载请注明来源：内存溢出

单词标志匹配语言设置

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-16

下一篇 2022-12-16

登录后才能评论