科百科
当前位置: 首页 范文大全

ocr精准识别架构(支持最广的OCR开源平台)

时间:2023-08-13 作者: 小编 阅读量: 5 栏目名: 范文大全

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如PaddleOCR、ChineseOCR、ChineseOCR-lite等;通过实际搭建比对,存在如下不足:识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;跨

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如 PaddleOCR、ChineseOCR、ChineseOCR-lite等;

通过实际搭建比对,存在如下不足:

  • 识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S
  • 图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;
  • 跨平台能力、多语言支持较差,通常只支持python、C,其他语言需要通过相关协议衔接,如Http Restful接口协议等;
  • 模型优化更新慢;通常部分开源产品,可能是大厂KPI的产品,存在长时间不更新的情况,而小白本身又不具备优化能力,因此,也是让产品无法进入实用化场景;

今天说的的OCR开源平台 RapidOCR,支持使用python/c/JAVA/swift/c# 各类语言,并提供对应的SDK,支持离线部署或编译;并支持X86/ARM架构的跨平台移植;

平台基本每个月都会针对模型识别准确度、识别效率与速度进行相关优化,并发布相关的模型包;

系统整体架构过程

官方提供的工程示例(C、Java、.Net、Android、Python等):

RapidOCR├── android# 安卓工程目录├── api4cpp# c语言跨平台接口库源码目录,直接用根下的CMakelists.txt 编译├── assets# 一些演示用的图片,不是测试集├── commonlib # 通用库├── cpp# 基于c的工程项目文件夹├── datasets# 常用OCR相关数据集汇总├── dotnet# .Net程序目录├── FAQ.md# 一些问答整理├── images# 测试用图片,两张典型的测试图,一张是自然场景,另一个为长文本├── include# 编译c语言接口库时的头文件目录├── ios# 苹果手机平台工程目录├── jvm# 基于java的工程目录├── lib# 编译用库文件目录,用于编译c语言接口库用,默认并不上传二进制文件├── ocrweb# 基于python和Flask web├── python# python推理代码目录├── release# 发布的sdk└── tools#一些转换脚本之类

安装部署方式(Docker方式,这里贡献Dockerfile):

FROM python:3.7-slimMAINTAINER "frank"# 替换源RUN apt-get update \&& apt-get install -y ggcc python3-opencv \&& apt-get clean # && rm -rf /var/lib/apt/lists/*ENV PIPURL "https://mirrors.aliyun.com/pypi/simple"WORKDIR /opt/ocrCOPY . .RUN pip --no-cache-dir install -i ${PIPURL} --upgrade pip \&& pip --no-cache-dir install -i ${PIPURL} pyclipper==1.2.0 Shapely==1.7.1 onnxruntime==1.7.0 opencv_python==4.5.1.48 six==1.15.0 numpy==1.19.2 Pillow==8.3.0 flaskEXPOSE 9003WORKDIR /opt/ocr/ocrwebCMD python main.py

脚本示例:

  • Python版本(其他版本暂不列举)

# 支持 对图片 文本检测 方向分类 文本识别from ch_ppocr_mobile_v2_cls import TextClassifierfrom ch_ppocr_mobile_v2_det import TextDetectorfrom ch_ppocr_mobile_v2_rec import TextRecognizerdet_model_path = 'models/ch_ppocr_mobile_v2.0_det_infer.onnx'cls_model_path = 'models/ch_ppocr_mobile_v2.0_cls_infer.onnx'rec_model_path = 'models/ch_ppocr_mobile_v2.0_rec_infer.onnx'image_path = r'test_images/det_images/1.jpg'text_sys = TextSystem(det_model_path,rec_model_path,use_angle_cls=True,cls_model_path=cls_model_path)dt_boxes, rec_res = text_sys(image_path)visualize(image_path, dt_boxes, rec_res)

通过实践,相同内容的图片,采用RapidOCR的模型识别,速度上,基本≤5s返回识别结果;

识别示例:

动态识别图片

C、JAVA 识别展示

.net 识别展示

相关问题,欢迎留言提问;欢迎大家点赞、关注、收藏~

    推荐阅读
  • 在家怎么做煎饼果子才能更劲道(煎饼果子看似简单)

    煎饼果子是我们这些上班族,每天缺少不可的美食。下面我就给大家分享一下天津煎饼果子的制作方法,希望大家喜欢!煎饼果子来一套制作:1.铁板放置煤气炉上烧制200℃左右,用工具把面糊倒在铁板上,用旋子刮成薄圆状并成熟,然后刷上酱料,在撒上葱花,香菜末,芝麻粒,鲜蔬,薄脆,在根据顾客需求刷上辣椒油即可。

  • 超保暖羽绒服搭配(冬天要辣也要暖)

    冬天搭配既要穿得火辣又要穿出足够的保暖度,上面这几种羽绒服,保暖值超赞的同时还可以穿出洋气感爆棚的搭配效果哦,不信的话就赶快来试一试吧!

  • 梁山好汉谁能打败卢俊义(梁山一百零八将尽遭诛杀)

    宋江为此大怒,不顾卢俊义的劝阻,将守夜的头目、喽啰全部斩首。宋江、吴用商议,决定分头应对,先派戴宗、周通去徐宁在东京的故交范天喜处打听蔡京出师消息,又派秦明等六位头领去救援盐山。邓宗弼、辛从忠因粮草将尽,不久收兵退走,秦明等也返回梁山。就是暗示着梁山一百零八位好汉最终将被以三十六员雷将为代表的官军势力剿灭,并将最后剩下的三十六位好汉押解到东京献俘。

  • 云南省16届运动会歌(云南省第十二届少数民族传统体育运动会会徽)

    将聘请丽江市相关专家组成评委会对应征作品进行分类评选。超过上述时间,无论何种原因,均不具有应征资格。一经发现,立即取消其参评资格,并追回奖金。云南省第十二届少数民族传统体育运动会丽江市筹备委员会办公室2022年1月28日

  • 汝子可教也是什么意思(孺子可教的出处及典故)

    出自西汉·司马迁《史记·留侯世家》。他原是韩国名门公子,姓姬,后来因为行刺秦始皇未遂,逃到下邳隐匿,才改名为张良。张良更吃惊了,盯着老人离开的背影。第五天早上,张良赶到桥上。又过了五天,公鸡一打鸣,张良就出发赶到桥上。第二天早晨,张良看那本书,乃是《太公兵法》。张良觉得这事很奇特,于是常常用功钻研此书。后来,张良研读《太公兵法》很有成效,成了汉高祖刘邦的重要谋士,为刘邦建立汉朝立下了汗马功劳。

  • c语言求最大公约数方法的区别(这就是C语言新手和入门的区别吗)

    前言本文主要介绍的是C语言常规的一道题,希望对于广大读者学习C语言有一些帮助。该问题可以采用辗转相除法去解决!辗转相除法欧几里德算法又称辗转相除法,欧几里德算法是用来求两个正整数最大公约数的算法。古希腊数学家欧几里德在其著作《TheElements》中最早描述了这种算法,所以被命名为欧几里德算法。扩展欧几里德算法可用于RSA加密等领域。视频不深奥,不需要钻研,在公交、在地铁、在厕所都可以观看,随时随地涨姿势

  • 伊万卡·特朗普,站在世界权游顶端的超级白富美

    伊万卡·特朗普,世界超级名模,集团副总裁,美国第一女儿,老公是犹太地产大亨的儿子。她还自创“IvankaTrump”品牌,销售包括成衣、珠宝、女鞋、香水。身材高挑并当过模特的她还亲自担任了自家品牌的代言人。借助父亲的“高山”,伊万卡·特朗普被任命为白宫高级顾问,和其夫库什纳活跃在新闻头条。特区总检察长指控其滥用资金、贪污受贿,甚至参与国会山暴乱。2024她的父亲是否能重回权力巅峰,可能会影响其笑容的灿烂程度。

  • 济宁团组织关系毕业转接时间安排 济宁市团关系接收

    参军入伍的毕业学生团员团组织关系转接工作:应根据部队的要求,在办理参军入伍手续时一并办理好“智慧团建”系统中团组织关系转接手续。按工作阶段组织关系转接申请期:5月1日至8月31日,发起方提出“学社衔接”转接申请,“智慧团建”系统暂不作强制性处理,发起方可随时撤销,接收方可根据实.际情况进行审核。

  • 纳指量化交易策略模型(凯纳资本创始合伙人陈曦)

    资料显示,陈曦先生是国内最早一批从事量化投资的基金经理,曾经获得2017年新财富Top50对冲基金经理奖等多项荣誉。而由他所创办的纳璞淳资产在国内进行量化交易已经长达8年时间。对于目前国内的量化投资市场,陈曦认为,这是一片蓝海,是竞争比较少的一个领域。而对于中国未来的量化投资市场,他给出判断,必将会朝着分化的趋势发展。陈曦认为,“我觉得今年应该会是量化选股的一个大年。”