将字典转换为DataFrame并进行频次统计的方法

yipeiwu_com6年前Python基础

首先将一个字典转化为DataFrame,然后以DataFrame中的列进行频次统计。

代码如下:

import pandas as pd
a={'one':['A','A','B','C','C','A','B','B','A','A'],
 'tao':['B','B','C','C','A','A','C','B','C','A'],
 'three':['C','B','A','A','B','B','B','A','C','D']}
b=pd.DataFrame(a)
b.describe()

b是转换后DataFrame,显示如表格:

 one tao three
0 A B C
1 A B B
2 B C A
3 C C A
4 C A B
5 A A B
6 B C B
7 B B A
8 A C C
9 A A D

频次统计如表格:

 one tao three
count 10 10 10
unique 3 3 4
top A C B
freq 5 4 4

其中count是总共变量数量,unique是每列有几个变量,top是频次最高的那个变量,freq是频次最高变量出现的频次。

以上这篇将字典转换为DataFrame并进行频次统计的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

在Django的模型和公用函数中使用惰性翻译对象

在模型和公用函数中,使用ugettext_lazy()和ungettext_lazy()来标记字符串是很普遍的操作。 当你在你的代码中其它地方使用这些对象时,你应当确定你不会意外地转换它...

详解python 中in 的 用法

详解python 中in 的 用法

in在Python中是操作符,具体来说是成员操作符。就是对于序列(字符串,元组,列表)或集合(set)或映射(字典)这些数据类型做成员判断,自然成员判断的返回是在其中和不在其中,用Py...

Python合并2个字典成1个新字典的方法(9种)

字典是Python语言中唯一的映射类型。 映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。 字典对象是可变的,它是一个容器类型...

python 解析html之BeautifulSoup

复制代码 代码如下:# coding=utf-8 from BeautifulSoup import BeautifulSoup, Tag, NavigableString from S...

pytorch中的自定义数据处理详解

pytorch在数据中采用Dataset的数据保存方式,需要继承data.Dataset类,如果需要自己处理数据的话,需要实现两个基本方法。 :.getitem:返回一条数据或者一个样本...