Python基于百度云文字识别API

yipeiwu_com6年前Python基础

本文实例为大家分享了Python实现最简单的文字识别的具体代码,供大家参考,具体内容如下

Python版本:3.6.5

百度云提供的文字识别技术,准确率还是非常高的,而且每天还有5w次免费的调用量,对于用来学习或者偶尔拿来用用,已经完全足够了。文章提供一个模板,稍加修改就可以直接套用。注释中提到必须输入的地方,你都正确地输入了的话,就可以完成一次简单的文字识别了。

# -*- coding: utf-8 -*-
 
import requests
import base64
 
class Orc_main():
  def orc_look(self, path):
    access_token = "" # 自行注册百度云账号,即可获取自己专属的access_token,必须输入!
    with open(path, 'rb') as f:
      image_data = f.read()
      base64_ima = base64.b64encode(image_data)
      data = {
        'image': base64_ima
      }
      headers = {
        'Content-Type': 'application/x-www-form-urlencoded'
      }
      url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + str(access_token)
      r = requests.post(url, params=headers, data=data).json()
      for word in r['words_result']:
        yield word['words']
      # 返回一个生成器,可自行修改
 
if __name__ == '__main__':
  om = Orc_main()
  path = "" # 图片文件路径,必须输入!
  words = om.orc_look(path) 
  # 输出文字(返回结果)
  for word in words:
    print(word)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python中字典映射类型的学习教程

字典是python语言中唯一的映射类型,用花括号{}表示,一个字典条目就是一个键值对,方法keys()返回字典的键列表,values()返回字典的值列表,items()返回字典的键值对列...

Python3多线程基础知识点

多线程类似于同时执行多个不同程序,多线程运行有如下优点: 使用线程可以把占据长时间的程序中的任务放到后台去处理。 用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件...

python实现百度关键词排名查询

就是一个简单的python查询百度关键词排名的函数,以下是一些简介:1、UA随机2、操作简单方便,直接getRank(关键词,域名)就可以了3、编码转化。编码方面应该没啥问题了。4、结果...

在Python中使用__slots__方法的详细教程

正常情况下,当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性。先定义class: >>> cla...

python修改操作系统时间的方法

本文实例讲述了python修改操作系统时间的方法。分享给大家供大家参考。具体实现方法如下: #-*- coding:utf-8 -*- import socket import st...