详解Python里使用正则表达式的ASCII模式

详解Python里使用正则表达式的ASCII模式,第1张

概述ASCIIASCII(AmericanStandardCodeforInformationInterchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其

ASCII

ASCII(American Standard Code for information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础。

目前,基本上都使用python3来开发了,但是有时为了兼容旧的python2的代码,在正则表达式里主要是字符串的表示方式不同了,在python3里是使用Unicode来表示字符串和正则表达式,而在python2里是使用ASCII来表示的,所以在python3里怎么样设置才兼容旧的方式呢?其实可以通过ASCII的标志来解决,如下面的例子:

#python 3.6 #蔡军生  #http://blog.csdn.net/caimouse/article/details/51749579 # import re text = u'Français złoty Österreich' pattern = r'\w+' ascii_pattern = re.compile(pattern,re.ASCII) unicode_pattern = re.compile(pattern) print('Text  :',text) print('Pattern :',pattern) print('ASCII  :',List(ascii_pattern.findall(text))) print('Unicode :',List(unicode_pattern.findall(text))) 

结果输出如下:

Text  : Français złoty ÖsterreichPattern : \w+ASCII  : ['Fran','ais','z','oty','sterreich']Unicode : ['Français','złoty','Österreich']

总结

以上所述是小编给大家介绍的详解Python里使用正则表达式的ASCII模式,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对编程小技巧网站的支持!

总结

以上是内存溢出为你收集整理的详解Python里使用正则表达式的ASCII模式全部内容,希望文章能够帮你解决详解Python里使用正则表达式的ASCII模式所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/langs/1201311.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存