使用python读取.text文件特定行的数据方法

yipeiwu_com6年前Python基础

如何用python循环读取下面.txt文件中,用红括号标出来的数据呢?

python读取.text文件特定行的数据

首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式。

再加上,对读和写文件的操作,就行了

注:我用的是pycharm+python2.7

话不多说,直接上代码

 
import re
 
f1=file('shen.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
 
for line in data1:
 data2=line.split()
 # print data2[0]
 m = re.findall(r"[0-9]:", data2[0])
 if m:
  results.append(line)
 
 # for i in data2[0]:
  # data3=i.split(":")
  # print data3
  # if data3>=0 and data3<=50000:
  #  results.append(line)
 
 
  # if i=='1':
  #  results.append(line)
 
 
f2=file('deal.txt','w')
f2.writelines(results)
f2.close()

前期,我遇到“1:”这样的字符串实在是没办法处理,后来查找资料,发现有正则这么爽的东西!

在上面的代码中,需要说明的是:

m = re.findall(r"[0-9]:", data2[0])

该语句的意思就是,对于字符串而言,寻找到能够匹配1:,2:,9:。。。。。。的字符串

最后处理的结果是:

python读取.text文件特定行的数据

由于数据不是很漂亮,还需要将里面的“,”和“:”这两个符号去掉,因此,我使用了replace语句

代码如下:

#coding:utf-8
#__author__ ='dell'
 
import re
 
f1=file('shen.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
 
for line in data1:
 data2=line.split()
 # print data2[0]
 m = re.findall(r"[0-9]:", data2[0])
 if m:
  results.append(line)
 
 # for i in data2[0]:
  # data3=i.split(":")
  # print data3
  # if data3>=0 and data3<=50000:
  #  results.append(line)
 
 
  # if i=='1':
  #  results.append(line)
 
f2=file('deal.txt','w')
f2.writelines(results)
f2.close()
 
# 替换掉所有的逗号,
f4=open('deal.txt','r')
data3=f4.read()
f4=data3.replace(',',' ')
f5=file('deal.txt','w')
f5.write(f4)
f5.close()
 
# 替换掉所有的冒号
f6=open('deal.txt','r')
data4=f6.read()
f6=data4.replace(':',' ')
f7=file('deal.txt','w')
f7.write(f6)
f7.close()

最终,得到的数据就很漂亮了,如下所示:

python读取.text文件特定行的数据

以上这篇使用python读取.text文件特定行的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python+rsync精确同步指定格式文件

本文实例为大家分享了python+rsync精确同步指定格式文件的具体代码,供大家参考,具体内容如下 # coding: utf-8 #!/usr/bin/env python '...

Python 调用 Outlook 发送邮件过程解析

Python 调用 Outlook 发送邮件过程解析

微软 Office 提供基于 COM 接口的编程。Python 通过 pywin32 可以方便地调用各组件。如果下载和安装 pywin32 有困难,可以到 Sourceforge 的镜像...

python脚本实现验证码识别

python脚本实现验证码识别

最近在折腾验证码识别。最终的脚本的识别率在92%左右,9000张验证码大概能识别出八千三四百张左右。好吧,其实是验证码太简单。下面就是要识别的验证码。 我主要用的是Python中的P...

使用Python发送邮件附件以定时备份MySQL的教程

最近迁移了wordpress,系统升级为CentOS 6,很奇怪的一个问题,在原来CentOS 5.8下用的很正常的定时备份数据库并通过邮件发送的脚本不能发送附件,其他都正常,邮件内容也...

django启动uwsgi报错的解决方法

django启动uwsgi报错的解决方法

uwsgi介绍 uWSGI是一个Web服务器,它实现了WSGI协议、uwsgi、http等协议。Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。 要注意 W...