python实现根据文件关键字进行切分为多个文件的示例

yipeiwu_com6年前Python基础

来源:在工作过程中,需要统计一些trace信息,也就是一些打点信息,而打点是通过关键字进行的,因此对一个很大的文件进行分析时,想把两个打点之间的内容单独拷贝出来进行分析。

#!/usr/bin/env python
#__*__ coding: utf-8 __*__
import re
import linecache
 
def fileParse():
 inputfile = input('Input SourcFile:') ##输入源文件,如A.txt
 fp = open(inputfile, 'r')
 
 number =[]
 lineNumber = 1
 keyword = input('Slice Keyword:') ##输入你要切分的关键字
 outfilename = input('Outfilename:')##输出文件名,如out.txt则写out即可,后续输出的文件是out0.txt,out1.txt...
 
 for eachLine in fp:  
  m = re.search(keyword, eachLine) ##查询关键字
  if m is not None:
   number.append(lineNumber) #将关键字的行号记录在number中
  lineNumber = lineNumber + 1
 size = int(len(number))
 for i in range(0,size-1):
  start = number[i]
  end = number[i+1]
  destLines = linecache.getlines(inputfile)[start+1:end-1] #将行号为start+1到end-1的文件内容截取出来
  fp_w = open(outfilename + str(i)+'.txt','w') #将截取出的内容保存在输出文件中
  for key in destLines:
   fp_w.write(key)
  fp_w.close()
 
if __name__ == "__main__":
 fileParse()

以上这篇python实现根据文件关键字进行切分为多个文件的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python批量修改图片分辨率的实例代码

前言:处理图片需要,需把图片都转换成1920*1280的大小, python实现很方便,需要导入图片处理的Image包和匹配的glob包,很简单,代码如下: img_path = g...

Python中关于Sequence切片的下标问题详解

前言 在python中, 切片是一个经常会使用到的语法, 不管是元组, 列表还是字符串, 一般语法就是: sequence[ilow:ihigh:step] # ihigh,step...

详解Python3 pickle模块用法

pickle(python3.x)和cPickle(python2.x的模块)相当于java的序列化和反序列化操作。 常采用下面的方式使用: import pickle pickle...

tensorflow实现softma识别MNIST

识别MNIST已经成了深度学习的hello world,所以每次例程基本都会用到这个数据集,这个数据集在tensorflow内部用着很好的封装,因此可以方便地使用。 这次我们用tenso...

使用Python和OpenCV检测图像中的物体并将物体裁剪下来

使用Python和OpenCV检测图像中的物体并将物体裁剪下来

介绍 硕士阶段的毕设是关于昆虫图像分类的,代码写到一半,上周五导师又给我新的昆虫图片数据集了,新图片中很多图片很大,但是图片中的昆虫却很小,所以我就想着先处理一下图片,把图片中的昆虫裁剪...