Pandas过滤dataframe中包含特定字符串的数据方法

yipeiwu_com5年前Python基础

假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢?

因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。

举例说明:

我希望提取所有包含'Mr.'的人名

Pandas过滤dataframe 特定字符串

1、首先将他们进行字符串化,并得到其对应的布尔值:

>>> bool = df.str.contains('Mr\.') #不要忘记正则表达式的写法,'.'在里面要用'\.'表示
>>> print('bool : \n', bool)

Pandas过滤dataframe 特定字符串

2、通过dataframe的基本操作将其选取出来:

>>> filter_data = df[bool]
>>> print('filter data : \n', filter_data)

Pandas过滤dataframe 特定字符串

总结:这样就成功将特定数据选取出来了,将代码汇总一下就是

>>> bool = df.str.contains('Mr\.')
>>> filter_data = df[bool]

以上这篇Pandas过滤dataframe中包含特定字符串的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Django获取该数据的上一条和下一条方法

使用Django的ORM操作的时候,想要获取本条,上一条,下一条。 初步的想法是写3个ORM,3个ORM如下: 本条:models.Obj.objects.filter(id=n).fi...

Django数据库类库MySQLdb使用详解

Django项目要操作数据库,首先要和数据库建立连接,才能让程序中的数据和数据库关联起来进行数据的增删改查操作 Django项目默认使用mysqldb模块进行和mysql数据库之间的交互...

python matplotlib折线图样式实现过程

python matplotlib折线图样式实现过程

这篇文章主要介绍了python matplotlib折线图样式实现过程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 一:简单的折线图...

使用Python求解最大公约数的实现方法

1. 欧几里德算法 欧几里德算法又称辗转相除法, 用于计算两个整数a, b的最大公约数。其计算原理依赖于下面的定理: 定理: gcd(a, b) = gcd(b, a mod b) 证明...

python的变量与赋值详细分析

python的变量与赋值详细分析

python的变量与赋值 1.变量的命名规则 变量其实通过一个标记调用内存中的值,而变量名就是这个标记的名称,但是万一这个标记已经被提前占用或者解释器认为这个标记是不合法的,那么就会报...