对pandas数据判断是否为NaN值的方法详解

yipeiwu_com6年前Python基础

实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分。

具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割。

def age_map(x):
 if x < 26:
  return 0
 elif x >=26 and x <= 35:
  return 1
 elif x > 35 and x <= 45:
  return 2
 elif pd.isnull(x): #判断是否为NaN值,== 和in 都无法判断
  return 3
 else:
  return 4

也就是用pandas自带的函数来表示:

pd.isnull(x) 

最后我们可以应用map函数:

data['age'] = data['birth_year'].map(age_map)

以上这篇对pandas数据判断是否为NaN值的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python数据分析中Groupby用法之通过字典或Series进行分组的实例

在数据分析中有时候需要自己定义分组规则 这里简单介绍一下用一个字典实现分组 people=DataFrame( np.random.randn(5,5), columns=...

python多重继承实例

本文实例讲述了python多重继承用法,分享给大家供大家参考。具体实现方法如下: 1.mro.py文件如下: #!/usr/bin/python # Filename:mro.py...

Django处理Ajax发送的Get请求代码详解

Django处理Ajax发送的Get请求代码详解

Django处理Ajax发送的Get请求实例,Ajax优点在一是异步请求,无需等待响应就可以再次发起请求,而是局部刷新,避免整个页面刷新的网页闪动。 打开命令行窗口,输入命令,创建dja...

Python正确重载运算符的方法示例详解

前言 说到运算符重载相信大家都不陌生,运算符重载的作用是让用户定义的对象使用中缀运算符(如 + 和 |)或一元运算符(如 - 和 ~)。说得宽泛一些,在 Python 中,函数调用(()...

Python bsddb模块操作Berkeley DB数据库介绍

bsddb模块是用来操作bdb的模块,bdb是著名的Berkeley DB,它的性能非常好,mysql的存储后端引擎都支持bdb的方式。这里简单介绍一些关于bsddb的使用方法。 bdb...