Pandas过滤dataframe中包含特定字符串的数据方法

yipeiwu_com6年前Python基础

假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢?

因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。

举例说明:

我希望提取所有包含'Mr.'的人名

Pandas过滤dataframe 特定字符串

1、首先将他们进行字符串化,并得到其对应的布尔值:

>>> bool = df.str.contains('Mr\.') #不要忘记正则表达式的写法,'.'在里面要用'\.'表示
>>> print('bool : \n', bool)

Pandas过滤dataframe 特定字符串

2、通过dataframe的基本操作将其选取出来:

>>> filter_data = df[bool]
>>> print('filter data : \n', filter_data)

Pandas过滤dataframe 特定字符串

总结:这样就成功将特定数据选取出来了,将代码汇总一下就是

>>> bool = df.str.contains('Mr\.')
>>> filter_data = df[bool]

以上这篇Pandas过滤dataframe中包含特定字符串的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python 字符串大小写转换的简单实例

①所有字母都转换为大写 # -*- coding:utf-8 -*- if __name__ == "__main__":     a = 'hello,...

Python二维数组实现求出3*3矩阵对角线元素的和示例

题目:求一个3*3矩阵对角线元素之和。 程序分析:利用双重for循环控制输入二维数组,再将a[i][i]累加后输出。 def two_dimensionalArray(self):...

使用Python设计一个代码统计工具

问题 设计一个程序,用于统计一个项目中的代码行数,包括文件个数,代码行数,注释行数,空行行数。尽量设计灵活一点可以通过输入不同参数来统计不同语言的项目,例如: # type用于指定文...

python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法

字典是另一种可变容器模型,且可存储任意类型对象。 字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ; 字典值可...

python3编码问题汇总

python3编码问题汇总

这两天写了个监测网页的爬虫,作用是跟踪一个网页的变化,但运行了一晚出现了一个问题。。。。希望大家不吝赐教! 我用的是python3,错误在对html response的decode时抛出...