网站首页 > 精选文章 正文
今天我们要学习的是在Python通过调用外部应用识别图片中的文字(OCR)。我们并不需要探究艰深的图像识别的原理和算法,只需要站在巨人的肩膀上知道如何调用百度的文字识别服务就可以用二三十行代码高效实现这个功能了。
首先,我们需要注册百度AI开放平台(ai.baidu.com),点击控制台后找到人工智能中的文字识别创建一个新应用,然后在应用详情里记下我们代码中所需的AppID、API Key、Secret Key。
接下来安装SDK。CMD打开命令提示符,输入pip install baidu-aip即可,如果没有安装pip,会提示命令不存在,已安装可以跳过下面两步。
安装pip包。到pypi.python.org/pypi/pip下载并解包,打开命令提示符窗口,在pip的目录下执行命令:python setup.py install。如果提示“ImportError: No module named setuptools”则说明缺少 “setuptools ”包。
安装setuptools包。到
pypi.org/project/setuptools下载并解包,打开命令提示符窗口,在setuptools的目录下执行命令:python setup.py install。
完成以上准备步骤后,开始编程。(图1)
三个常量均为标示用户,为访问百度云做签名验证。AipOcr是百度的Python SDK客户端的功能之一,为我们提供了一系列的识别图片文字的方法。
要调用这一功能非常简单。只需要这一句即可将图片中的文字识别并返回:
result = client.basicGeneral(image);
现在我们通过以下实例代码获得本地图片信息,执行图像识别,结果用print 输出看看。百度识别结果为每行文字一个大括号,再用两行代码整理一下文本格式,程序如图2。
执行程序,最基本的文字识别结果如图3,这个应用流程应该是本地识别图片信息上传至百度云运算返回识别结果,经过测试识别效果优质高效。
当然这仅仅实现了最简单的本地图片文字的基本识别。这个接口还有多项参数可以支持多国语言和各类证照票据二维码等特殊图片的识别。有兴趣的小朋友可以在
https://cloud.baidu.com/doc/OCR/s/Rjwvxzm3n查看接口文档。
这项服务的特殊功能有每天500次的免费使用次数,对于个人学习是完全够用了,如果作为公开应用超量的话还需要付费。
这次我们使用百度提供的服务直接跨进了OCR软件的门槛,在百度AI开放平台上还有语音识别、人脸识别、机器学习、图像识别等众多高大上的功能,直接使用这些人工智能的成果完成自己的应用是不是觉得编程更加有趣了?
# coding=gbk
from aip import AipOcr
# 定义常量
""" 你的 APPID AK SK """
APP_ID = '你的 APPID'
API_KEY = '你的 APP AK'
SECRET_KEY = '你的 APP SK'
# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('本地图片地址')
# 调用通用文字识别, 图片为本地图片
result = client.basicGeneral(image);
print (result)
#将所有的文字都合并到一起
for item in result['words_result']:
print(item['words'])
猜你喜欢
- 2025-05-26 一听就懂:用Python做一个超简单的小游戏
- 2025-05-26 基于深度学习OpenCV与python进行字符识别
- 2025-05-26 仅需 15 行 Python 代码,即可将视频文件转录为文本稿件
- 2025-05-26 老外最喜欢的美食圣地 是不是你家?python 分析20w数据 「附代码」
- 2025-05-26 Python 中的可变和不可变:面向初学者的完整指南
- 2025-05-26 这一篇就够了!带你全面了解Python的异常处理机制
- 2025-05-26 python3 matplotlib下增加新字体并使用
- 2025-05-26 Python,pyttsx3,实现语音合成,实现语音朗读,文字转语音
- 2025-05-26 python应用:如何用python提取pdf文件中的文字
- 2025-05-26 Markdown + 文档管理 + 静态网页生成,集大成的 Markdown 应用:MWeb
- 最近发表
- 标签列表
-
- 向日葵无法连接服务器 (32)
- git.exe (33)
- vscode更新 (34)
- dev c (33)
- git ignore命令 (32)
- gitlab提交代码步骤 (37)
- java update (36)
- vue debug (34)
- vue blur (32)
- vscode导入vue项目 (33)
- vue chart (32)
- vue cms (32)
- 大雅数据库 (34)
- 技术迭代 (37)
- 同一局域网 (33)
- github拒绝连接 (33)
- vscode php插件 (32)
- vue注释快捷键 (32)
- linux ssr (33)
- 微端服务器 (35)
- 导航猫 (32)
- 获取当前时间年月日 (33)
- stp软件 (33)
- http下载文件 (33)
- linux bt下载 (33)