使用python读取.text文件特定行的数据方法

yipeiwu_com6年前Python基础

如何用python循环读取下面.txt文件中,用红括号标出来的数据呢?

python读取.text文件特定行的数据

首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式。

再加上,对读和写文件的操作,就行了

注:我用的是pycharm+python2.7

话不多说,直接上代码

 
import re
 
f1=file('shen.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
 
for line in data1:
 data2=line.split()
 # print data2[0]
 m = re.findall(r"[0-9]:", data2[0])
 if m:
  results.append(line)
 
 # for i in data2[0]:
  # data3=i.split(":")
  # print data3
  # if data3>=0 and data3<=50000:
  #  results.append(line)
 
 
  # if i=='1':
  #  results.append(line)
 
 
f2=file('deal.txt','w')
f2.writelines(results)
f2.close()

前期,我遇到“1:”这样的字符串实在是没办法处理,后来查找资料,发现有正则这么爽的东西!

在上面的代码中,需要说明的是:

m = re.findall(r"[0-9]:", data2[0])

该语句的意思就是,对于字符串而言,寻找到能够匹配1:,2:,9:。。。。。。的字符串

最后处理的结果是:

python读取.text文件特定行的数据

由于数据不是很漂亮,还需要将里面的“,”和“:”这两个符号去掉,因此,我使用了replace语句

代码如下:

#coding:utf-8
#__author__ ='dell'
 
import re
 
f1=file('shen.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
 
for line in data1:
 data2=line.split()
 # print data2[0]
 m = re.findall(r"[0-9]:", data2[0])
 if m:
  results.append(line)
 
 # for i in data2[0]:
  # data3=i.split(":")
  # print data3
  # if data3>=0 and data3<=50000:
  #  results.append(line)
 
 
  # if i=='1':
  #  results.append(line)
 
f2=file('deal.txt','w')
f2.writelines(results)
f2.close()
 
# 替换掉所有的逗号,
f4=open('deal.txt','r')
data3=f4.read()
f4=data3.replace(',',' ')
f5=file('deal.txt','w')
f5.write(f4)
f5.close()
 
# 替换掉所有的冒号
f6=open('deal.txt','r')
data4=f6.read()
f6=data4.replace(':',' ')
f7=file('deal.txt','w')
f7.write(f6)
f7.close()

最终,得到的数据就很漂亮了,如下所示:

python读取.text文件特定行的数据

以上这篇使用python读取.text文件特定行的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python正则表达式和元字符详解

正则表达式 正则表达式是一种强大的字符串操作工具。它是一种领域特定语言 (DSL),不管是 Python 还是在大多数现代编程语言中都是作为库存在。 它们主要面向两种任务: - 验...

在Python的Django框架中加载模版的方法

为了减少模板加载调用过程及模板本身的冗余代码,Django 提供了一种使用方便且功能强大的 API ,用于从磁盘中加载模板, 要使用此模板加载API,首先你必须将模板的保存位置告诉框架。...

老生常谈进程线程协程那些事儿

老生常谈进程线程协程那些事儿

一、进程与线程 1.进程 我们电脑的应用程序,都是进程,假设我们用的电脑是单核的,cpu同时只能执行一个进程。当程序出于I/O阻塞的时候,CPU如果和程序一起等待,那就太浪费了,cpu会...

利用Python中的pandas库对cdn日志进行分析详解

前言 最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志...

Django admin美化插件suit使用示例

Django admin美化插件suit使用示例

本文主要对Django美化插件做一个简单介绍,具体如下。 Django Suit 效果 使用前django页面 使用后django页面 安装 官方文档 http://django-s...