宜配屋

用Python进行简单图像识别（验证码）

yipeiwu_com6年前 (2020-03-06)Python基础

这是一个最简单的图像识别，将图片加载后直接利用Python的一个识别引擎进行识别

将图片中的数字通过 pytesseract.image_to_string(image)识别后将结果存入到本地的txt文件中

 #-*-encoding:utf-8-*-
 import pytesseract
 from PIL import Image
 
 class GetImageDate(object):
 def m(self):
  image = Image.open(u"C:\\a.png")
  text = pytesseract.image_to_string(image)
  return text
 
 def SaveResultToDocument(self):
  text = self.m()
  f = open(u"C:\\Verification.txt","w")
  print text
  f.write(str(text))
  f.close()
 
 g = GetImageDate()
 g.SaveResultToDocument()

具体想要实现上面的代码需要安装两个包和一个引擎
在安装之前需要先安装好Python，pip并配置好环境变量

所有包的安装都是通过pip来安装的，需要在windows PowerShell中进行，并且是在 C:\Python27\Scripts目录下

1.第一个包： pytesseract

pip install pytesseract

若是出现安装错误的情况，安装不了的时候，可以将命令改为 pip.exe install pytesseract来安装
若是将pip修改为pip.exe安装成功后，那么下文的所有pip都需要改为pip.exe

2.第二个包：PIL安装

pip install PIL

若是失败了可以如下修改 pip install PILLOW

3.安装识别引擎tesseract-ocr

下载 tesseract-ocr，进行默认安装
安装完成后需要配置环境变量，在系统变量path后增加 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR；
一切都安装完成后运行上述代码，会发现报错，此时需要

至此结束。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持【听图阁-专注于Python设计】。

用Python进行简单图像识别（验证码）

相关文章

Python 读取用户指令和格式化打印实现解析

Python面向对象之类的内置attr属性示例

深入理解Django的自定义过滤器

Python文件去除注释的方法

TensorFlow神经网络优化策略学习

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

用Python进行简单图像识别（验证码）

相关文章

Python 读取用户指令和格式化打印实现解析

Python面向对象之类的内置attr属性示例

深入理解Django的自定义过滤器

Python文件去除注释的方法

TensorFlow神经网络优化策略学习

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号