网站首页 > 精选文章 正文
原创 春风视觉
- 介绍
1.1 cnocrcnocr是一款文字识别python包,支持中文和英文等多种语言,主要针对排版简单的印刷体文字图片,通常可结合文字检测引擎使用。该识别引擎遵循OSI Approved :: Apache Software License协议,在github地址:https://github.com/breezedeus/cnocr/#readme。python版本需要大于3。1.2 cnstd
cnstd是一款文字检测工具, 支持中文和英文等检测,自带多个训练模型,安装时使用pip安装即可,通常与cnocr一起使用。遵循协议为:
OSI Approved :: Apache Software License,支持python3.X以上版本,在github地址中为:https://github.com/breezedeus/cnstd。 - 安装与依赖包对图像进行处理需要安装opencv包,具体查看各自github下的requirments.txt文件,执行pip批量安装命令即可。
pip install -r requirements.txt
执行上述命令后执行下列命令:
#安装cnocr 安装过程中会安装torch,可新建虚拟环境测试
pip install cnocr 或
pip install cnocr -i https://pypi.doubanio.com/simple #指定源
#安装cnstd
pip install cnstd 或
pip install cnstd -i https://pypi.doubanio.com/simple #指定源
3. 检测与调用
3.1 cnstd使用
cnstd使用比较简单,执行cmd命令,执行下列命令后得结果。
cnstd predict -i examples/taobao.jpg -o outputs
从上图得结果可以看出cnstd可以准确得识别出文字位置。除cmd命令外,还可以执行下面得py代码。
from cnstd import CnStd
from cnocr import CnOcr
import cv2 as cv
std = CnStd(auto_rotate_whole_image=True) #这里指定模型及其他参数
cn_ocr = CnOcr()
box_info_list = std.detect('E:/100.png')
image = cv.imread('E:/100.png')
point_color = (0, 255, 0) # BGR
thickness = 1
lineType = 4
white = (0, 255, 128)
for box_info in box_info_list['detected_texts']:
# 获取坐标
cor = box_info['box']
#print(box_info)
box = cor[0:4]
ptLeftTop=(0,0)
ptRightBottom=(0,0)
if abs(box[-1]) > 80:
#存在倾斜或旋转得状况,此时中心点不变,长和宽位置互换
ptLeftTop = (int(box[0]-box[3]/2), int(box[1] - box[2]/2)) #int(box[1])
ptRightBottom = (int(box[0] + box[3]/2),int(box[1]+box[2]/2))
else:
ptLeftTop = (int(box[0]-box[2]/2), int(box[1] - box[3]/2)) #int(box[1])
ptRightBottom = (int(box[0]+box[2]/2), int(box[1] + box[3]/2))
cv.rectangle(image, ptLeftTop,ptRightBottom, point_color, 1)
#cv.circle(image, ptLeftTop, 5, white)
#cv.circle(image, ptRightBottom, 10, (0,0,0))
cv.imwrite("result_cnstd.png", image)
得到的结果如下图:
3.2 cnocr使用
按照上面代码继续执行如下代码块:
for box_info in box_info_list['detected_texts']:
cropped_img = box_info['cropped_img']
ocr_res = cn_ocr.ocr_for_single_line(cropped_img)
print('ocr result: %s' % str(ocr_res))
执行代码完成后,结果如下图所示,以元组形式展示,第一个元素表示字符内容,第二个元素表示置信度。
除可以进行单行识别外,还可以进行整体识别。此时结果与上面结果大体相同。执行代码片段如下。
from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('E:/100.png')
print("Predicted Chars:", res)
对cnocr的其他测试情况,见github库中的测试用例,地址如下。https://github.com/breezedeus/cnocr/blob/master/tests/test_cnocr.py。
猜你喜欢
- 2025-05-26 一听就懂:用Python做一个超简单的小游戏
- 2025-05-26 基于深度学习OpenCV与python进行字符识别
- 2025-05-26 仅需 15 行 Python 代码,即可将视频文件转录为文本稿件
- 2025-05-26 老外最喜欢的美食圣地 是不是你家?python 分析20w数据 「附代码」
- 2025-05-26 Python 中的可变和不可变:面向初学者的完整指南
- 2025-05-26 这一篇就够了!带你全面了解Python的异常处理机制
- 2025-05-26 python3 matplotlib下增加新字体并使用
- 2025-05-26 Python,pyttsx3,实现语音合成,实现语音朗读,文字转语音
- 2025-05-26 python应用:如何用python提取pdf文件中的文字
- 2025-05-26 Markdown + 文档管理 + 静态网页生成,集大成的 Markdown 应用:MWeb
- 最近发表
- 标签列表
-
- 向日葵无法连接服务器 (32)
- git.exe (33)
- vscode更新 (34)
- dev c (33)
- git ignore命令 (32)
- gitlab提交代码步骤 (37)
- java update (36)
- vue debug (34)
- vue blur (32)
- vscode导入vue项目 (33)
- vue chart (32)
- vue cms (32)
- 大雅数据库 (34)
- 技术迭代 (37)
- 同一局域网 (33)
- github拒绝连接 (33)
- vscode php插件 (32)
- vue注释快捷键 (32)
- linux ssr (33)
- 微端服务器 (35)
- 导航猫 (32)
- 获取当前时间年月日 (33)
- stp软件 (33)
- http下载文件 (33)
- linux bt下载 (33)