首页 > 自考资讯 > 自考知识

AI测评丨十二款开源OCR开箱测评,文字识别哪家强

头条共创 2024-08-11

什么OCR工具免费开源最好用?

哪个OCR识别印刷类文档图片综合能力最高?

在大规模文档自动化处理中,哪个OCR工具的性能最为稳定?

哪个OCR识别旋转图片准确率最高?

哪个OCR工具在处理低分辨率或模糊图片时表现最佳?

哪个OCR最擅长识别手写文字?

哪个OCR识别复杂的自然场景图片综合能力最强?

哪个OCR识别艺术字表现最好?

……

目前开源OCR工具种类繁多,不同场景图像的识别效果却参差不齐,这给开发人员的选型工作带来了不小的挑战。

为此,广州软件院先进软件测评实验室对12款开源OCR工具进行了全面测试,旨在提供客观准确的选型依据。这些工具包括PaddleOCR、RapidOCR、读光(开源版)、ChineseOCR、EasyOCR、Tesseract、OcrLiteOnnx、Surya、docTR、JavaOCR等独立工具,以及RagFlow、Unstructured等文档分析OCR组件。

评估基于五类数据集,包括印刷中文、印刷英文、手写文字、自然场景和变形字体,考察了字符集覆盖范围(生僻字)、字体形变(艺术字、验证码)以及图像旋转、干扰信息、光照条件、模糊等外部因素的影响。选用的数据集涵盖了Synthetic Chinese String、CTW、ICDAR 2019 - ArT、Chinese MNIST、CASIA HWDB2.0、CCPD、CRPD 和PubTabNet等主流资源,确保了评估结果的广泛性和可靠性,具体测评数据集如下:

备注:本次测评均使用OCR工具自身提供的预训练模型进行测试,测试均采用工具的示例中提供的参数设置。除开源工具以外,选取百度OCR云服务测试结果作为参照。

字符识别准确率(Precision):正确识别的字符数/识别输出总字符数字符识别召回率(Recall):正确识别的字符数/验证集总字符数字符识别综合评分(F-Score):2*Precision*Recall/(Precision+Recal)平均响应时间:基准样本识别总时间/样本数量。

测评结果

印刷中文的综合测评结果为:

印刷中文的综合评分前三分别是RapidOCR、RagFlow和Surya。

印刷英文的综合测评结果为:

印刷英文综合前三分别是Surya、Unstructured和读光OCR,还是国外开源软件领先。

….

由于篇幅所限,部分内容未能详尽展开,点击「链接」以获得更全面的测评信息

版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除

猜你喜欢