python实现简单的文字识别

yipeiwu_com6年前Python基础

本文实例为大家分享了python实现简单的文字识别的具体代码,供大家参考,具体内容如下

Python版本:3.6.5

百度云提供的文字识别技术,准确率还是非常高的,而且每天还有5w次免费的调用量,对于用来学习或者偶尔拿来用用,已经完全足够了。文章提供一个模板,稍加修改就可以直接套用。注释中提到必须输入的地方,你都正确地输入了的话,就可以完成一次简单的文字识别了。

# -*- coding: utf-8 -*-
 
import requests
import base64
 
class Orc_main():
 def orc_look(self, path):
  access_token = "" # 自行注册百度云账号,即可获取自己专属的access_token,必须输入!
  with open(path, 'rb') as f:
   image_data = f.read()
   base64_ima = base64.b64encode(image_data)
   data = {
    'image': base64_ima
   }
   headers = {
    'Content-Type': 'application/x-www-form-urlencoded'
   }
   url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + str(access_token)
   r = requests.post(url, params=headers, data=data).json()
   for word in r['words_result']:
    yield word['words']
   # 返回一个生成器,可自行修改
 
if __name__ == '__main__':
 om = Orc_main()
 path = "" # 图片文件路径,必须输入!
 words = om.orc_look(path) 
 # 输出文字(返回结果)
 for word in words:
  print(word)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python中日志logging模块的性能及多进程详解

python中日志logging模块的性能及多进程详解

前言 Java 中最通用的日志模块莫过于 Log4j 了,在 python 中,也自带了 logging 模块,该模块的用法其实和 Log4j 类似。日志是记录操作的一种好方式。但是日...

Python生成不重复随机值的方法

本文实例讲述了Python生成不重复随机值的方法。分享给大家供大家参考。具体分析如下: 这里从一列表中,生成不重复的随机值 算法实现如下: import random total =...

python将字符串转换成json的方法小结

最近在工作中遇到了一个小问题,如果要将字符串型的数据转换成dict类型,我第一时间就想到了使用json函数。但是里面出现了一些问题 1、通过json来转换: In [1]: impo...

Python Queue模块详细介绍及实例

Python Queue模块 Python中,队列是线程间最常用的交换数据的形式。Queue模块是提供队列操作的模块,虽然简单易用,但是不小心的话,还是会出现一些意外。 创建一个“队列...

Python实现手机号自动判断男女性别(实例解析)

Python实现手机号自动判断男女性别(实例解析)

本文性别判断主要依靠airtest中的自动化测试实现 通过自动对比支付宝页面男女图像,从而实现男女判断 代码如下: 男女判断函数: // An highlighted block...