特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

python+Tesseract-OCR实现图片识别（只适合新手）

来源：互联网收集：自由互联发布时间：2022-07-05

1.首先准备环境： python版本：2.7/3.6 操作系统：windows系统 2.准备工具： tesseract-ocr 安装后设置好环境变量链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med Pycharm 3.安装相关python包

1.首先准备环境：

python版本：2.7/3.6

操作系统：windows系统

2.准备工具：

tesseract-ocr 安装后设置好环境变量

链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med

Pycharm

3.安装相关python包（作者使用的是py3.6）

pip install Pillow

pip install pytesseract

4.使tesseract-ocr与python关联，从而使python能够调用Tesseract-OCR程序识别验证码/文字：

修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'

5.pycharm中程序运行

from PIL import Image
import pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径，路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)

注意图片为当前目录

完成！

上一篇：Pycharm新建文件时自动添加基础信息
下一篇：没有了