Python3实现获取图片文字里中文的方法分析

yipeiwu_com5年前Python基础

本文实例讲述了Python3实现获取图片文字里中文的方法。分享给大家供大家参考,具体如下:

一、运行环境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow与pytesseract库安装:

pip3 install pillow
pip3 install pytesseract

(5)  识别引擎tesseract-ocr ,下载之后解压安装,下载地址:https://www.jb51.net/softs/538925.html

二、 运行代码

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #设置为中文文字的识别
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #设置为英文或阿拉伯字母的识别
print(text)

三、报错解决

1.FileNotFoundError:[WinError 2]系统找不到指定文件。

解决办法:

打开文件pytesseract.py,找到如下代码,将tesseract_cmd的值修改为全路径,再次使用就不会报这个错了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr

解决办法:

打开文件pytesseract.py,找到image_to_string,指定config的参数,如下:

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python数据结构与算法教程》、《Python编码操作技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程

希望本文所述对大家Python程序设计有所帮助。

相关文章

Mac安装python3的方法步骤

Mac安装python3的方法步骤

Python有两个版本,一个是2.x版,一个是3.x版,这两个版本是不兼容的。 现在 Mac 上默认安装的 python 版本为 2.7 版本,若 安装 新版本需要 通过 该地址进行下载...

Python的Flask框架的简介和安装方法

请在开始使用 Flask 之前阅读本文。也希望本文能够回答关于 Flask 项目的初衷以及目标,以及 flask 适用的场景(情境)等问题。 什么是 “微”? “微” (“Micro”)...

pygame实现雷电游戏雏形开发

pygame实现雷电游戏雏形开发

本文实例为大家分享了pygame实现雷电游戏开发代码,供大家参考,具体内容如下 源代码: stars.py #-*- coding=utf-8 -*- #!/usr/bin/pyt...

python多进程并发demo实例解析

这篇文章主要介绍了python多进程并发demo实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 前言 下午需要简单处理一份数据...

python数据封装json格式数据

最简单的使用方法是: >>> import simplejson as json >>> json.dumps(['foo', {'bar':...