python实现查找excel里某一列重复数据并且剔除后打印的方法

yipeiwu_com6年前Python基础

本文实例讲述了python实现查找excel里某一列重复数据并且剔除后打印的方法。分享给大家供大家参考。具体分析如下:

在python里面excel的简单读写操作我这里推荐使用xlrd(特别是读操作)

import xlrd 
def open_excel(fileName="simple.xls"):
  try:
    fileHandler = xlrd.open_workbook(fileName)
    return fileHandler
  except Exception, e:
    print str(e)  
def scan_excel(sheet_name1=u'Sheet1'):
  handler = open_excel()
  page = handler.sheet_by_name(sheet_name1)
  return page
def trim_cols(index=0):
  page = scan_excel()
  col1 = page.col_values(index)
  col2 = []
  for item in col1:
    if item not in col2:
      col2.append(item)
  print col1
  print col2
def main():
  trim_cols()
if __name__ == "__main__":
  main()  

输出结果:

[1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0]
[1.0, 2.0, 3.0, 4.0]

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python解决pandas处理缺失值为空字符串的问题

踩坑记录: 用pandas来做csv的缺失值处理时候发现奇怪BUG,就是excel打开csv文件,明明有的格子没有任何东西,当然,我就想到用pandas的dropna()或者fillna...

Python使用random.shuffle()打乱列表顺序的方法

Python的random.shuffle()函数可以用来乱序序列,它是在序列的本身打乱,而不是新生成一个序列。 示例: from random import shuffle x =...

python 调试冷知识(小结)

python 调试冷知识(小结)

对于 python 代码的调试我们通常都是使用 IDE 自带的调试功能。但是 IDE 提供的调试功能存在局限性,例如在测试服务器上调试代码,但是又不可能在测试服务器上安装 IDE 进行调...

使用memory_profiler监测python代码运行时内存消耗方法

使用memory_profiler监测python代码运行时内存消耗方法

前几天一直在寻找能够输出python函数运行时最大内存消耗的方式,看了一堆的博客和知乎,也尝试了很多方法,最后选择使用memory_profiler中的mprof功能来进行测量的,它的原...

python中xrange和range的区别

range 函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例:复制代码 代码如下...