如果您要提高效率:
import recount = sum(1 for _ in re.finditer(r'b%sb' % re.escape(word), input_string))
这不需要创建任何中间列表(与不同
split()),因此可以有效地处理较大的
input_string值。
它还具有正确使用标点符号的好处-它将正确返回
1为短语的计数
"Mike saw adog."(而无参数的则
split()不会)。它使用
b正则表达式标志,该标志在单词边界(
waka
[a-zA-Z0-9_]和其他任何东西之间的转换)上匹配。
如果您需要担心ASCII字符集以外的语言,则可能需要调整正则表达式以正确匹配那些语言中的非单词字符,但是对于许多应用程序来说,这可能会过于复杂,在许多其他情况下,设置unipre和/或正则表达式的区域设置标志就足够了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)