1.首先准备环境: python版本:2.7/3.6 操作系统:windows系统 2.准备工具: tesseract-ocr 安装后设置好环境变量 链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med Pycharm 3.安装相关python包
1.首先准备环境:
python版本:2.7/3.6
操作系统:windows系统
2.准备工具:
tesseract-ocr 安装后设置好环境变量
链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med
Pycharm
3.安装相关python包(作者使用的是py3.6)
pip install Pillow
pip install pytesseract
4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:
修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'
5.pycharm中程序运行
from PIL import Imageimport pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径,路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)
注意图片为当前目录
完成!