利用Python正则表达式过滤敏感词的方法

yipeiwu_com6年前Python基础

问题描述:很多网站会对用户发帖内容进行一定的检查,并自动把敏感词修改为特定的字符。

技术要点:

1)Python正则表达式模块re的sub()函数;

2)在正则表达式语法中,竖线“|”表示二选一或多选一。

参考代码:

Python正则表达式过滤敏感词

以上这篇利用Python正则表达式过滤敏感词的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python xlwt如何设置单元格的自定义背景颜色

问题 我使用python 2.7和xlwt模块进行excel导出 我想设置我知道可以使用的单元格的背景颜色 style1 = xlwt.easyxf('pattern: patter...

Python修改Excel数据的实例代码

在前面的文章中介绍了如何用Python读写Excel数据,今天再介绍一下如何用Python修改Excel数据。需要用到xlutils模块。下载地址为https://pypi.python...

Python使用scrapy采集时伪装成HTTP/1.1的方法

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下: 添加下面的代码到 settings.py 文件 复制代码 代码如下:DOW...

Python PIL读取的图像发生自动旋转的实现方法

对于手机、相机等设备拍摄的照片,由于手持方向的不同,拍出来的照片可能是旋转0°、90°、180°和270°。即使在电脑上利用软件将其转正,他们的exif信息中还是会保留方位信息。 在用P...

使用pytorch和torchtext进行文本分类的实例

文本分类是NLP领域的较为容易的入门问题,本文记录我自己在做文本分类任务以及复现相关论文时的基本流程,绝大部分操作都使用了torch和torchtext两个库。 1. 文本数据预处理 首...