python用字典统计单词或汉字词个数示例

yipeiwu_com6年前Python基础

有如下格式的文本文件

复制代码 代码如下:

/“/请/!/”/“/请/!/”/两名/剑士/各自/倒转/剑尖/,/右手/握/剑柄/,
/左手/搭于/右手/手背/,/躬身行礼/。/两/人/身子/尚未/站/直/,
/突然/间/白光闪/动/,/跟着/铮的/一/声响/,
/双剑相/交/,/两/人/各/退一步/。
/旁/观众/人/都/是/“/咦/”/的/一声/轻呼/。/青衣/剑士/连/劈/三/剑/

将这段话进行词频统计,结果是  词—词数  的形式,比如  请  2  ,并把结果放到txt文件中。

这样的问题利用词或单词作为字典的key,循环判断有不有这个key,没有新增一个,有的话,将这个key对应的value加1

复制代码 代码如下:

#coding:utf-8
word_lst = []
word_dict = {}

with open("中文.txt","r") as f1 ,open("词次数.txt",'w') as f2:
   for line in f1:
       word_lst.append(line.split('/'))

   for item in word_lst:
       for item2 in item:
           if item2.strip() not in ",!。“”" :
               if   item2 not in word_dict:
                   word_dict[item2] = 1
               else :
                   word_dict[item2] += 1

   for key in word_dict:
       print key,word_dict[key]
       f2.write(key+' '+str(word_dict[key]))

相关文章

Python 性能优化技巧总结

1.使用测量工具,量化性能才能改进性能,常用的timeit和memory_profiler,此外还有profile、cProfile、hotshot等,memory_profiler用了...

python训练数据时打乱训练数据与标签的两种方法小结

如下所示: <code class="language-python">import numpy as np data = np.array([[1,1],[2,2...

django基础之数据库操作方法(详解)

django基础之数据库操作方法(详解)

Django 自称是“最适合开发有限期的完美WEB框架”。本文参考《Django web开发指南》,快速搭建一个blog 出来,在中间涉及诸多知识点,这里不会详细说明,如果你是第一次接触...

numpy 进行数组拼接,分别在行和列上合并的实例

numpy 进行数组拼接,分别在行和列上合并的实例

在进行数据分析的时候,会把把一些具有多个特征的样本数据进行拼接合并吗,放在一起分析,预测.... 下面是用numpy中的函数进行数组的拼接。 (1)方法一。np.vstack() v 表...

Python max内置函数详细介绍

Python max内置函数 max(iterable, *[, key, default]) max(arg1, arg2, *args[, key]) Return the larg...