Python判断文本中消息重复次数的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python判断文本中消息重复次数的方法。分享给大家供大家参考,具体如下:

#coding:gbk
'''
Created on 2012-2-3
从文件中读取文本,并判断文本中形如“message0”、“message123”这样的消息有多少条是重复的
@author: Administrator
'''
import re
if __name__ == '__main__':
  pattern = u"(message((\d)+))"
  prog = re.compile(pattern)
  # read text from file
  f = open("1003.txt","r")
  text = unicode(f.read())
  f.close()
  result = prog.findall(text)
  message_map = dict()
  redupicate_count = 0
  for message in result:
    if message_map.has_key(message[0]) == True:
      print message[0], "is reduplicate"
      redupicate_count += 1
    else :
      message_map[message[0]] = 1;
  print "total reduplicate message is ", redupicate_count

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

对numpy中的数组条件筛选功能详解

在程序设计中,时常会遇到数据的唯一化、相同、相异信息的提取等工作,在格式化的向量存储矩阵中南,numpy能够提供比较不错的快速处理功能。 1,唯一化的实现: In [63]: dat...

python创建和使用字典实例详解

字典是python中唯一内建的映射类型。字典中的值并没有特殊的顺序,但是都存储在一个特定的键(key)里。键可以是数字,字符串甚至是元组。1. 创建和使用字典字典可以通过下面的方式创建:...

使用python读取txt文件的内容,并删除重复的行数方法

注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字。 #coding:utf-8 import shutil readDir = "原文件绝对路经...

python使用pip安装SciPy、SymPy、matplotlib教程

背景: 使用pip install SciPy的格式安装python函数库SciPy的时候,发现老是报错,从网上找信息也没找到合适的解决办法,最后使用whl格式文件安装成功。 过程: 本...

python自动化测试之异常及日志操作实例分析

本文实例讲述了python自动化测试之异常及日志操作。分享给大家供大家参考,具体如下:   为了保持自动化测试用例的健壮性,异常的捕获及处理,日志的记录对掌握自动化测试执行情况尤为重要,...