当前位置 : 主页 > 编程语言 > python >

python+Tesseract-OCR实现图片识别(只适合新手)

来源:互联网 收集:自由互联 发布时间:2022-07-05
1.首先准备环境: python版本:2.7/3.6 操作系统:windows系统 2.准备工具: tesseract-ocr 安装后设置好环境变量 链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med Pycharm 3.安装相关python包

1.首先准备环境:

python版本:2.7/3.6

操作系统:windows系统

2.准备工具:

tesseract-ocr 安装后设置好环境变量

链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med 

Pycharm

3.安装相关python包(作者使用的是py3.6)

pip install Pillow

pip install pytesseract

4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:

修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'

5.pycharm中程序运行

from PIL import Image
import pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径,路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)

注意图片为当前目录

完成!


上一篇:Pycharm新建文件时自动添加基础信息
下一篇:没有了
网友评论