pandas对dataFrame中某一个列的数据进行处理的方法

yipeiwu_com6年前Python基础

背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值

下面例子中的df均为pandas.DataFrame()的数据

1、增加新列,或更改某列的值

df["列名"]=值

如果值为固定的一个值,则dataFrame中该列所有值均为这个数据

2、处理某列

df["列名"]=df.apply(lambda x:方法名(x,入参2),axis=1)

说明:

1、方法名为单独的方法名,可以处理传入的x数据

2、x为每一行的数据,做为方法的入参1;x中的数据可以用【x.列名】来获取

3、入参2等为方法需要的其他参数,不需要可以不写

4、axis=1,表示每次取一行数据进行处理,按行处理

例子如下:

根据列title的是否包含特定词,来赋值给新的列1或0的值

bugInfo['IntegrationTest'] = bugInfo.apply(lambda x: self.bug_rule(x, "IntegrationTest"), axis = 1)
 
def bug_rule(self, frame, type): # 处理列表中的数据,更新到sql数据库中
  result = "0"
  if type == "SmokeTest": # 冒烟测试
    if re.search("^\[冒烟\]|\[冒烟测试\]|【冒烟】|【冒烟测试】", frame["title"]):
      result = "1"
  elif type == "InterfaceTest": # 接口测试
    if re.search("^\[接口\]|\[接口测试\]|【接口】|【接口测试】", frame["title"]):
      result = "1"
  elif type == "IntegrationTest": # 集成测试
    if self.IntegrationTime != "" and self.IntegrationTime == frame["created_time"]:
      result = "1"
  return result

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

基于python脚本实现软件的注册功能(机器码+注册码机制)

一、前言: 目的:完成已有python图像处理工具的注册功能 功能:用户运行程序后,通过文件自动检测认证状态,如果未经认证,就需要注册。注册过程是用户将程序运行后显示的机器码(C盘的卷序...

python分布式计算dispy的使用详解

dispy,是用asyncoro实现的分布式并行计算框架。 框架也是非常精简,只有4个组件,在其源码文件夹下可以找到: dispy.py (client) provides two wa...

Python元组操作实例分析【创建、赋值、更新、删除等】

Python元组操作实例分析【创建、赋值、更新、删除等】

本文实例讲述了Python元组操作。分享给大家供大家参考,具体如下: #coding=utf8 ''''' 元组是跟列表非常相近的另一种容器类型。 元组是一种不可变类型,一旦创建不可...

Python和php通信乱码问题解决方法

即使在urlencode之前str.decode(“cp936″).encode(“utf-8″)做了编码转换也是没用的。后来查询手册查到一个urllib.quote()函数,用此方法成...

使用Python通过win32 COM打开Excel并添加Sheet的方法

使用Python通过win32 COM打开Excel并添加Sheet的方法

对win32 COM不是很熟悉,不知道一个程序究竟有多少属性或者方法可以操作。仅仅是一个Sheet页的添加就费了我好长时间,因为这种成功来自于试探。 编辑代码如下: #!/usr/b...