离线图片转文字 OCR 工具:Umi-OCR

Umi-OCR 是一款开源、免费、高效、强悍的离线 OCR 文字识别工具,支持截图识别、批量导入图片识别,还可以对识别的文字进行排版,在日常工作中非常实用。虽然你可能一段时间用不到这个工具,但是绝对值得收藏,妥妥的生产力工具。

umi-ocr 截图识别文字

Umi-OCR github:https://github.com/hiroi-sora/Umi-OCR

Umi-OCR V2 github:https://github.com/hiroi-sora/Umi-OCR_v2

Umi-OCR 的特点

文字排版

对识别结果进行文字排版,这个非常实用,我在测试的过程中,尝试使用了“多行-自然段”的情景,可以对文字按自然段排版,最接近真实的使用环境。支持以下几种排版方式,竖排还支持从左到右或者从右到左。

单行:合并同一行的文字,适合绝大部分情景。

多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景。

多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。

竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

忽略区域

umi-ocr 批量识别图片获取文字,可以设置忽略区域

可以设置一个或多个的矩形框,在执行批量 OCR 的时候,这些区域会被排除。

注意:因为忽略区域是针对批量图片 OCR 处理而设置的,所以只针对一种分辨率生效。假如配置的分辨率是 1920×1080,那么批量识别图片时,只有符合 1920×1080 的图片才会排除干扰文本,1920×1081 的图片中的文字会全部输出。

自行添加多国语言

V1.3 版在下载的时候可以下载多国语言整合版,如果下载的是简体中文和英文通用识别库的,可以手动下载扩展包,扩展包内置了繁体中文、英文、日文、韩文、俄语、德文、法文,也可以手动添加 PP-OCR 模型库。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>