前段时间做了车牌识别相关的内容分享,参看: 车牌识别(1)-车牌数据集生成 车牌识别(2)-搭建车牌识别模型 今天给大家分享一个简单的OCR文本识别工具:easyo
前段时间做了车牌识别相关的内容分享,参看:
车牌识别(1)-车牌数据集生成
车牌识别(2)-搭建车牌识别模型
今天给大家分享一个简单的OCR文本识别工具:easyocr。这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。当然这个模块适当改进也可以用以车牌识别
1.安装
pip install easyocr它会安装除了模型文件之外的所有依赖,模型文件则会在运行代码的时候下载。
在pytorch网站上,请确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。
gpu版本的pytorch,所以运行比较慢。
2.使用教程
import easyocrreader = easyocr.Reader(['ch_sim']) # ch_sim是Chinese simplified简写result = reader.readtext('1.jpg')print(result)运行的过程中会安装所需要的模型文件,像下面这样:
由于它的下载速度非常慢,而且经常会失败,因此建议先下载好模型文件,再将其放置到所需要的位置:
中文(简体)模型(识别中文必须)https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip
中国(传统)模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip
拉丁模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip
日本模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip
韩文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip
泰文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip
阿拉伯文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip
如果下载速度太慢,请在公众号后台回复:easyocr(明天再试下载,今晚还没传输到网盘),下载文字检测模型(CRAFT)和中文简体模型文件包。
下载完模型后,将文件放到下面这个位置。
如下图所示:
重新执行脚本不会再提醒下载模型了,随便找的一个图片如下:
识别结果如下:
输出采用列表格式,每个list分别表示对应文字的边界框、识别文本结果和置信度。
对于多语种的情况:
效果如下:
总体效果还算不错,感兴趣的朋友可以试下车牌识别的效果,以及思考下如何改进车牌识别效果