中文ocr

发表于2022-07-17|更新于2022-07-17|学习

|浏览量:

cnocr

cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型，所以安装后即可直接使用。目前使用的识别模型是crnn，识别准确度约为 98.7%。

安装：pip install cnocr

代码引用

from cnocr import CnOcr 
ocr = CnOcr() 
res = ocr.ocr_for_single_line('test.png') 
print("Predicted Chars:", res)

首次使用cnocr时，系统会自动从Dropbox下载zip格式的模型压缩文件，并存于 ~~/.cnocr目录。下载后的zip文件代码会自动对其解压，然后把解压后的模型相关文件放于~~/.cnocr/models目录。如果系统不能自动从Dropbox成功下载zip文件，则需要手动下载此zip文件并把它放于 ~/.cnocr目录。另一个下载地址是百度云盘(提取码为pg26)。放置好zip文件后，后面的事代码就会自动执行了。

但是这样的识别并不准确，当图片中的文字太复杂的时候就需要另一个库的支持用于识别文字。

cnstd

安装：pip install cnstd

该库可以与cnocr无缝衔接：

from cnstd import CnStd
from cnocr import CnOcr

std = CnStd()
cn_ocr = CnOcr()

box_infos = std.detect('examples/taobao.jpg')

for box_info in box_infos['detected_texts']:
    cropped_img = box_info['cropped_img']
    ocr_res = cn_ocr.ocr_for_single_line(cropped_img)
    print('ocr result: %s' % str(ocr_res))

官方链接： cnstd cnocr

文章作者: 望

文章链接: https://m42-orion.github.io/2022/07/17/%E5%B7%A5%E5%85%B7-%E4%B8%AD%E6%96%87ocr/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源念念不忘，必有回响！

相关推荐

conda那些命令

命令创建虚拟环境： conda create --name my_first_env python=3.6 列出虚拟环境： conda env list 激活虚拟环境： conda activate my_first_env 查看环境信息： conda info -e 根据路径激活虚拟环境： conda source /root/python/bin/activate 推出虚拟环境： conda deactivate 删除虚拟环境： conda remove -n your_env_name --all 创建时候安装需要的包： conda create -n env_name numpy matplotlib python=2.7 在离线的时候创建虚拟环境： conda create -n env_name --offline python=3.8 环境复制： conda create --name new_env_name --clone old_env_name 查看所有包 : conda list conda...

python之__init__.py

神奇的__init____init__一般在两种情况下会出现，第一种是以在class（类）当中以函数形式出现，如下： 1234class test(object): def __init__(self,name,age): self.name = name self.age = age 第二种情况则是以__init__.py文件的形式出现在文件夹下。两种不同的情况虽然使用了相同名字的定义，但是其作用可以说类似又可以说不同。 def __init__(self)__init__属于魔法函数的一种,之所以说是一种其原因是因为魔法函数是一个大家族，常见的：__ str__()、__ new__()、__ unicode__()、__ call__()、__...

python代码片段(vscode)

python代码中的特殊注释

python代码中的特殊注释 **# noqa**：用法：some_code = "example" # noqa 功能：告诉flake8等工具忽略当前行的所有警告。 **# type: ignore**：用法：import some_module # type: ignore 功能：告诉mypy等类型检查器忽略当前行的类型检查警告。 **# pylint: disable=some-message**：用法：some_code = "example" # pylint: disable=unused-variable 功能：告诉pylint工具忽略特定的警告消息（例如未使用的变量）。 **# isort: skip**：用法：import some_module # isort: skip 功能：告诉isort工具在自动排序导入语句时跳过当前行。 # fmt: off 和 **# fmt: on**：用法：123# fmt: offsome_code =...

python库parse的使用

深入浅出解析 Python parse 库的使用parse 是 Python 中一个强大的字符串解析库，它能够根据指定的格式从字符串中提取出所需的数据。与 Python 内置的字符串格式化功能（如 str.format()）相反，parse 库的作用是从格式化字符串中反向提取数据。 1. 安装 parse 库在开始使用 parse 库之前，需要先安装它。可以通过以下命令安装： 1pip install parse 2. 基本用法parse 库的核心功能是通过 parse() 函数从字符串中提取数据。其基本语法如下： 123from parse import parseresult = parse(format_string, input_string) format_string：格式化字符串，用于定义提取数据的模式。 input_string：需要解析的输入字符串。 result：解析结果，返回一个 Result 对象。如果解析失败，返回 None。示例 1：提取简单数据1234from parse import parseresult =...

python数据校验

什么是数据校验？在实际的开发过程当中，我们往往会面临很多需要数据对接的情况，这时候一个函数可能需要处理一个或者多个数据参数，也就是说函数的参数面临着多且不确定性，参数本身不确定性还伴随着在传递过程当中是否符合规范的问题。以python函数为例，以下是随意写法和标准写法： 1234567891011121314151617181920212223# 随意def max(a,b): if a>b: return a elif a<b: return b return 0# 建议的标准写法def max(a:int=0, b:int=0)->int: """ 这里描述函数的功能 :param a: 参数描述 :param b: 参数描述 :returns: 返回描述 :raises keyError: 可能的错误捕获描述 """ if a>b: return a elif...