python3.x提取中文的正则表达式示例代码

yipeiwu_com6年前Python基础

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

Python中的CSV文件使用"with"语句的方式详解

是否可以直接使用with语句与CSV文件?能够做这样的事情似乎很自然: import csv with csv.reader(open("myfile.csv")) as reade...

用pandas按列合并两个文件的实例

用pandas按列合并两个文件的实例

直接上图,图文并茂,相信你很快就知道要干什么。 A文件: B文件: 可以发现,A文件中“汉字井号”这一列和B文件中“WELL”这一列的属性相同,以这一列为主键,把B文件中“TIME”...

Python音频操作工具PyAudio上手教程详解

Python音频操作工具PyAudio上手教程详解

​ 0.引子 当需要使用Python处理音频数据时,使用python读取与播放声音必不可少,下面介绍一个好用的处理音频PyAudio工具包。 PyAudio是Python开...

django模型中的字段和model名显示为中文小技巧分享

简单方法: models.py 复制代码 代码如下: class IceCreamBar(models.Model):     title =  ...

python正则表达式之作业计算器

python正则表达式之作业计算器

作业:计算器开发 实现加减乘除及拓号优先级解析 用户输入 1 - 2 * ( (60-30 +(-40/5) * (9-2*5/3 + 7 /3*99/4*2998 +10 * 568/...