「Docker」实测超轻量中文OCR开源项目，总模型仅17M |Python|Git|GPU|

机器之心报道
参与：肖清、思
想要试试中文 OCR？这个项目可以考虑，轻量模型，不需要 GPU 也能跑得动。

本文插图
光学字符识别（OCR）现在已经有很广泛的应用了，很多开源项目都会嵌入已有的 OCR 项目来扩展能力，例如 12306 开源抢票软件，它就会调用其它开源 OCR 服务来识别验证码。很多流行的开源项目，其背后或多或少都会出现 OCR 的身影。如果要说到中文 OCR ，像身份证识别、火车票识别都是常规操作，它也可以实现更炫酷的功能，例如翻译笔在书本上滑动一行，自动获取完整的图像，并识别与翻译中文。目前比较常用的中文 OCR 开源项目是 chineseocr ，它基于 YOLO V3 与 CRNN 实现中文自然场景文字检测及识别，目前该项目已经有 2.5K 的 Star 量。而本文介绍的是另一个新开源的中文 OCR 项目，它基于 chineseocr 做出改进，是一个超轻量级的中文字符识别项目。项目地址：https://github.com/ouyanghuiyu/chineseocr_lite该 chineseocr_lite 项目表示，相比 chineseocr ，它采用了轻量级的主干网络 PSENet ，轻量级的 CRNN 模型和行文本方向分类网络 AngleNet 。尽管要实现多种能力，但 chineseocr_lite 总体模型只有 17M 。目前 chineseocr_lite 支持任意方向文字检测，在识别时会自动判断行文本方向。我们可以先看看项目作者给出的效果示例：

本文插图

本文插图
可以看到， chineseocr_lite 在横排文字和竖排文字的识别上都有不错的效果，而且它提供的交互式网页端能直接在页面插入图像与调用识别模型。为了进一步挖掘该轻量级模型的效果，机器之心也上手测试了一番。项目实测由于Docker能够提供一个不依赖主机操作系统的隔离空间，并且兼具良好的安全性与可移植性，我们决定在Docker下对该轻量级模型进行测试。至于测试过程中的环境配置与采坑过程，后文会一一道来。先看看使用作者项目里自带图片的测试效果。识别结果与项目里提供的类似，这里耗时较长主要是由于我们测试时没有使用 GPU 的缘故。

本文插图
下面我们找一些其它图片来测试一下它的效果。

本文插图
可以看到该模型对于常规印刷字体的识别效果还是很好的。接下来我们决定找一个书法图片为难一下它，竟然一个也没有识别对？不过对于这样一个主打超轻量，总模型大小不超过 20M 的 OCR 项目来说，还要啥自行车。

本文插图
Docker 环境搭建我们的运行环境

Ubuntu 18.04
Python 3.6.9
Pytorch 1.5.0.dev20200227+cpu（作者推荐 1.2.0）

首先下载 Docker 镜像。这里推荐使用咱们中国人自己做的镜像 deepo ，一行代码傻瓜式安装 tensorflow、pytorch、darknet 等目前最新的深度学习框架。 deepo 链接：https://hub.docker.com/r/ufoym/deepo当安装好 Docker 后，用以下代码获取包含所有深度学习框架的镜像：
docker pull ufoym/deepo 在这里我们使用猪厂提供的国内源来加速下载：

docker pull hub-mirror.c.163.com/ufoym/deepo
上一页
1
2
下一页
		  	






























推荐阅读

           
                  
              
                  央视累计71157例，加拿大新增新冠肺炎确诊病例1176例 
                
                   
                
              
            

                  
              
                  花卉：养花经常掉叶子？可能是浇水出问题，赶紧改了，别忽视！ 
                
                   
                
              
            

                  
              
                  《庆余年2》播出有消息：郭麒麟壮到不敢认，叶灵儿换人成唯一败笔 
                
                   
                
              
            

                  
              
                  安徽：抗旱形势严峻 
                
                   
                
              
            

                  
              
                  华泰宝利格车怎么样 华泰宝利格怎么样 
                
                   
                
              
            

                  
              
                  上海市知识产权局网站|黄浦区多措并举积极推进知识产权领域双随机抽查工作 
                
                   
                
              
            

                  
              
                  爱豆App|真-电竞小说男主伯贤：“我终于可以吃鸡了！” 
                
                   
                
              
            

                  
              
                  北京一男子被盗，陪他报案的两个朋友……被抓了？！ 
                
                   
                
              
            

                  
              
                  直播吧|内维尔：蒂亚戈英语好在那里没用，利物浦当地口音太重 
                
                   
                
              
            

                  
              
                  『TOPWOMEN时髦笔记』次次出手都精彩绝伦，纪梵希“女魔头”正式卸任！三年高定系列 
                
                   
                
              
            

                  
              
                  江西都市现场|妻子抱怨丈夫总在晚上出去，民警一查，发现事情不简单 
                
                   
                
              
            

                  
              
                  青年|天龙老玩家为了奔现有多拼因一件棉衣造成的误会，结局皆大欢喜 
                
                   
                
              
            

                  
              
                  王者荣耀|S20赛季即将结束，夏洛特似女装亚瑟，钟馗也要出恐吓流玩法！ 
                
                   
                
              
            

                  
              
                  电池|三星Galaxy F41发布，6400万三摄+6000MAh，起售价1575元 
                
                   
                
              
            

                  
              
                  #第一篮球视角#书豪隔空送祝福：纽约，我从心底里爱着你，尼克斯重播林疯狂时刻 
                
                   
                
              
            

                  
              
                  「邱氏悬壶」适当的锻炼方法对于颈椎腰椎患者有好处 
                
                   
                
              
            

                  
              
                   新作|苍天白鹤携新作强势来袭，将《星峰传说》挤至榜二，9.9分夺榜一 
                
                   
                
              
            

                  
              
                  澎湃新闻|安倍晋三连续执政时间刷新纪录，政治遗产依然模糊？ 
                
                   
                
              
            

                  
              
                  小米苹果粥的禁忌 小米粥不宜放三样东西 
                
                   
                
              
            

                  
              
                  历届奥运会奖牌排行榜日本 
                
                   
                
              
            

          

「汽车动力总成公众号」新能源汽车底盘的轻量化 

「忧家娱乐」恒大三举措走出降负债新路径，提升动力+扎实底盘+轻量化 

「人人传播正能量」Pro 5G能有多快实测Sprint的5G网络，「图」一加7 

#骑乌龟的蜗牛#实测收益可观还有史诗，DNF：暗黑神殿才是平民玩家大号必刷副本 

车家号：GTA/GTAm官图发布，极度轻量化是亮点，阿尔法·罗密欧Giulia 

「汽车名苑」烧油如喝水？车主实测真实油耗！，“销量王”哈弗H6就是油老虎 

『』英特尔发布十代酷睿标压处理器 实测跑分首发 

『车与生活』NEDC续航706KM！实际能跑多远？实测结果来了，小鹏P7 

[小鹏P7]小鹏P7 NEDC续航706KM！实际能跑多远？实测结果来了 

实测石头手持无线吸尘器H6：大吸力长续航 轻松解决清洁难题