python实现简单的文字识别

yipeiwu_com5年前Python基础

本文实例为大家分享了python实现简单的文字识别的具体代码,供大家参考,具体内容如下

Python版本:3.6.5

百度云提供的文字识别技术,准确率还是非常高的,而且每天还有5w次免费的调用量,对于用来学习或者偶尔拿来用用,已经完全足够了。文章提供一个模板,稍加修改就可以直接套用。注释中提到必须输入的地方,你都正确地输入了的话,就可以完成一次简单的文字识别了。

# -*- coding: utf-8 -*-
 
import requests
import base64
 
class Orc_main():
 def orc_look(self, path):
  access_token = "" # 自行注册百度云账号,即可获取自己专属的access_token,必须输入!
  with open(path, 'rb') as f:
   image_data = f.read()
   base64_ima = base64.b64encode(image_data)
   data = {
    'image': base64_ima
   }
   headers = {
    'Content-Type': 'application/x-www-form-urlencoded'
   }
   url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + str(access_token)
   r = requests.post(url, params=headers, data=data).json()
   for word in r['words_result']:
    yield word['words']
   # 返回一个生成器,可自行修改
 
if __name__ == '__main__':
 om = Orc_main()
 path = "" # 图片文件路径,必须输入!
 words = om.orc_look(path) 
 # 输出文字(返回结果)
 for word in words:
  print(word)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python内存监控工具memory_profiler和guppy的用法详解

python2.7在内存管理上相比python3还是有些坑的,其释放后的内存仍然保留在python的内存池中,不被系统所用。python循环引用的变量不会被回收,这会导致程序越运行,占用...

Python中的groupby分组功能的实例代码

Python中的groupby分组功能的实例代码

pandas中的DataFrame中可以根据某个属性的同一值进行聚合分组,可以选单个属性,也可以选多个属性: 代码示例: import pandas as pd A=pd.DataF...

python绘制无向图度分布曲线示例

python绘制无向图度分布曲线示例

如下所示: #Copyright (c)2017, 东北大学软件学院学生 # All rightsreserved #文件名称:a.py # 作 者:孔云 #问题描述:统计图中的每...

Python装饰器基础详解

装饰器(decorator)是一种高级Python语法。装饰器可以对一个函数、方法或者类进行加工。在Python中,我们有多种方法对函数和类进行加工,比如在Python闭包中,我们见...

python3 下载网络图片代码实例

说明:这里仅展示在已经获取图片链接后的下载方式,对于爬虫获取链接部分参考前面的文章 1、利用文件读写的方式下载图片 #第一种:用urllib2模块下载 import urllib2...