首页 > 自考资讯 > 高考百科

那些不错的小众软件 篇二:一个不断趋近完美的ocr软件白描

小条 2024-07-05

本内容来自@WHAT IS WORTH BUYING APP,观点仅代表作者个人观点。

1 引言

白色绘图软件的使用可能自发布以来就已开始。最初,百度只有手机端的软件,但其简单的界面和易用性很快解决了我在OCR软件几乎不存在的情况下的问题。与当时的很多软件不同,识别后可以选择自己想要的文本,然后将其复制到剪贴板或直接导出到txt文件。

但之后随着使用场景的变化,线条画的弊端逐渐显现出来。由于它只支持移动设备,如果需要在PC端进行识别,则需要截图分享到手机上进行识别,然后将识别结果粘贴回电脑上。其使用场景将逐渐仅限于移动端使用。

这段时间,PC端不断出现很多优秀的OCR软件,比如天若OCR、熊猫OCR等优秀的国产软件。但缺点是设备支持不完善。这类软件的使用场景通常仅限于PC端,并且每天的识别次数通常也有限(尽管每天使用频率并不高)。 (不过,我有时确实会翻阅电子PDF,这是阅读文档时不可避免的。)它相对来说没什么用,没有它我也可以,但没有它我就活不下去。

此后,随着各大厂商的paddle OCR模型和OCR解决方案的普及,各种产品逐渐面世,其中许多产品内置于内部应用程序中。例如,如果您想识别百度网盘或微信上的图像,则需要打开软件,找到OCR功能区域,然后拖动图像进行识别。尝试次数没有限制,但体验绝不是完美的。

横向来说,国内很多OCR软件已经开始支持cnocr、paddleocr等离线模型,但是在下载的时候还是需要下载对应的模型,然后设置对应的路径,使用起来太贵了。

为了解决接口数量的限制,天若OCR等软件公开了定制接口。比如你可以去百度,购买一定数量的套餐,根据需要调用。但随着OCR技术的发展,识别场景不再局限于识别图像中的文字,很多情况下,如果需要识别表格,单纯购买百度的OCR接口反而无法满足您的需求。您将需要购买单独的接口。您还必须不时小心如何使用频率包,因为它也变得太昂贵而无法使用(您可以购买一次并使用很长一段时间,但我认为是这样)。优势不值得花费精力来维护它们)。

最近,我突然了解到百度不仅支持Windows,还支持Mac OS。这不是直接在软件层面上一体化了吗?您只需要一款软件,即可在任何设备上获得相同的体验。而且,这个会员只需要30元,就是一杯奶茶的价格,终身无限ID和表格,只需要在所有平台购买这个会员(作者是会员(发货时已经购买)首次推出)。用小钱办大事。

2 使用介绍

2.1 功能简介

这部分我不想截图,因为太麻烦了,所以直接从官网转发,请多多包涵。

0942593fbcf44c82a8794815da69529a~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=KEocGLLzcm7viKaTMzJ1RuQlVYU%3D 生成扫描件

这部分功能主要是能够产生清晰的扫描并自动分割边界。这也是扫描仪全能王的核心功能。

342409d3526f4a058a66ae57e2e69c8a~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=KMHiq4xKxC7ZB8S0BeaEDJ%2FXmqA%3D 文字识别

这部分的识别准确率始终处于较高水平,所以无需担心。我认为如果您可以选择要识别的部分并仅选择该部分中将被识别的文本会更好。

d13335bd9ff64f37b9a542af85c4d083~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=sxbQ3tITpnbsM00Jb5LRttXYJgc%3D 表格识别

这是我最近经常使用的一个功能,也是许多其他类似软件所没有的。识别后可以直接导出Excel文件,这对于您的财务朋友来说是个好消息。您每天都会接触到许多表单文件。

08482708eedd44b29a7e873e5e91275c~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=rLsPt0ESydXI%2FKi%2BfCVGR9NnuL4%3D 快捷方式识别

这部分的使用场景主要是在手机上,不需要先打开软件并选择图片,就可以通过快捷方式直接识别图片。

cc180e13214a45528946bae5480b8b1c~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=186idh01B3mZXWf%2B4kI3eSsOteM%3D 翻译

这个功能其实在日常生活中非常实用。作者写论文的时候根本不懂日语,但是由于相关的文档都是日文的,所以这个软件就识别出来了,把日文直接转换成了中文,方便阅读。

49cb5266f5704eddb8f41cb47e90fb97~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=fdGuNZTwFKiqqOY%2FfmKbC3q9q%2FE%3D 扫描边界

只识别必要的区域,消除背景环境的影响,是扫描全能王的核心功能。

631294695bc24eb7872ad49a0cd739f5~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=GdLWF%2FcKUhZjqYCxK7hDsab9RL0%3D 批次标识

这一功能使得百度成为一款覆盖整个场景、可以识别单张图像或多张图像的OCR软件。与仅支持单一功能的OCR 软件相比,这已经做得非常好了。

bcbd6e8824ae45ff903c0f0b04e279e4~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=F7pElFM36r7kQRKptl4L571qlLI%3D 校准

对此,可以同时对识别结果进行校准,保证输出结果的高精度,绝对可以胜过很多同类产品。

a47ea2c75b4348fcb479177ff00c2fc1~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=e0u1ltbyw9cb3t9AtMM2kqfKmeM%3D 同步识别

PC版发布后,这一点就不再有任何意义了。我这里就不详细说了。

2.2 电脑端实际使用体验

fdeb7454bff849c398ba637c264f7a8f~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=9GXVUjR%2BP521ynwOMZ%2FGPyM1S68%3D 普通接口

你会发现这个软件电脑版不仅支持表格识别和文字识别,还支持数学表达式识别。

6e8296201def470f87aa3ce078834610~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=DRwZGLvb6m%2BN679MIna5lrkL9Ko%3D 配置界面

设置界面除了提供快捷键设置快速识别截图之外,还提供了多种选项可供选择,基本涵盖了天若OCR的使用场景。

文字识别测试:

31d134cfbfad4073bb5c0bba2a340c7e~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=p0GEqQIwwqlz1aEYGbYEB8B2zHo%3D 文字识别

图片文字识别还是非常准确的,基本上没有错误。除了支持导出到剪贴板外,还支持导出到txt和docx格式的Word文档。

表单识别测试:

这里我们使用值得购买的公司的管理信息来进行测试。

59d05904ee2643bfaea96edf7c38c85f~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=2v2NxY2WyXk2iOw9dm8uAzJPdQQ%3D 测试图

4ebdfe9794a54db6940375a159ac86b7~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=WjKWDqYIAn72L%2BgIJv4yOnFZMgU%3D 鉴定结果1

ecab2b3740d4414d8cf906d71013a1a7~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=KOL4NK6HmvSD8ym72%2FGqNo5IE7I%3D 识别结果2

导出到Excel后可以看到,除了第一列干扰信息过多之外,基本格式还是比较完整的。

公式识别:

这里我们将使用微积分公式进行测试

f465157f62434f5cbfb5d94e41d7d582~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=150VRt%2FUYlOYRfHE1dwARkCtxNY%3D 微积分公式

e61223de3b5c48759cca27374ba80366~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720749571&x-signature=XrT2Q84frcURPYoiOZmTTFIuHlc%3D 识别结果3

可以看出表情识别结果还是比较完美的。

忘记说了,不仅可以导入图片进行识别,还可以截图后粘贴进行识别。

3 总结

笔者之前也纠结过paddleocr识别,也想纠结一下百度新推出的pp结构表识别,但是有一天发现这个软件后,似乎根本不需要纠结了。这是。

因此,在国庆节的最后一天,我向大家推荐这款软件。好的软件应该总是付出代价来不断改进其功能。与其花时间去做大事,不如花少量的钱办大事。

希望这个软件能够支持大家国庆后的工作和生活,提高效率。

我对这篇文章不感兴趣。我至少在5-6年前才推荐过这个软件。

作者声明本文与本文无任何利益关联,欢迎合理沟通、和谐讨论~

版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。

猜你喜欢