使用pandas批量处理矢量化字符串的实例讲解

yipeiwu_com6年前Python基础

进行已经矢量化后的字符串数据,可以使用pandas的Series数据对象的map方法。这样,对于未经矢量化的数据也可以先进行数据的矢量化转换然后再进行相应的处理。

举例实现字符串数据的操作,编写代码如下:

#!/usr/bin/python
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
seriers_data = Series(['Hello','Python','Data','World'])
print(seriers_data.map(str.lower))

程序的运行结果如下:

GreydeMac-mini:chapter07 greyzhang$ vim series_map.py
GreydeMac-mini:chapter07 greyzhang$ python series_map.py 
0   hello
1  python
2   data
3   world
dtype: object

上面的例子中,先对列表形式的数据进行了向量化的处理,讲数据处理成pandas的Series对象类型,然后进行矢量化的操作。通过Series的map方法对每个字符串进行了全都转换成小写字母的操作。

以上这篇使用pandas批量处理矢量化字符串的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python3 解决读取中文文件txt编码的问题

Python3 解决读取中文文件txt编码的问题

问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题。 照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: ‘utf-8' c...

Python3如何解决字符编码问题详解

Python3如何解决字符编码问题详解

编码 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是2...

Django框架的使用教程路由请求响应的方法

Django框架的使用教程路由请求响应的方法

路由 路由可以定义在工程的目录下(看你的需求),也可以定义在各个应用中来保存应用的路由,用主路文件urls中使用include()包含各个应用的子路由的数据 路由的解析顺序 Django...

在CentOS6上安装Python2.7的解决方法

在CentOS6上yum安装工具是基于Python2.6.6的,所以在CentOS6上默认安装的是Python2.6.6,因为要在服务器系统为CentOS6上部署生产环境,但是代码都是基...

python判断一个对象是否可迭代的例子

如何判断一个对象是可迭代对象? 方法是通过collections模块的Iterable类型判断: >>> from collections import Iter...