Umi-OCR 是一款开源、免费、高效、强悍的离线 OCR 文字识别工具,支持截图识别、批量导入图片识别,还可以对识别的文字进行排版,在日常工作中非常实用。虽然你可能一段时间用不到这个工具,但是绝对值得收藏,妥妥的生产力工具。
Umi-OCR github:https://github.com/hiroi-sora/Umi-OCR
Umi-OCR V2 github:https://github.com/hiroi-sora/Umi-OCR_v2
Umi-OCR 的特点
文字排版
对识别结果进行文字排版,这个非常实用,我在测试的过程中,尝试使用了“多行-自然段”的情景,可以对文字按自然段排版,最接近真实的使用环境。支持以下几种排版方式,竖排还支持从左到右或者从右到左。
单行:合并同一行的文字,适合绝大部分情景。
多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景。
多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。
竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。
忽略区域
可以设置一个或多个的矩形框,在执行批量 OCR 的时候,这些区域会被排除。
注意:因为忽略区域是针对批量图片 OCR 处理而设置的,所以只针对一种分辨率生效。假如配置的分辨率是 1920×1080,那么批量识别图片时,只有符合 1920×1080 的图片才会排除干扰文本,1920×1081 的图片中的文字会全部输出。
自行添加多国语言
V1.3 版在下载的时候可以下载多国语言整合版,如果下载的是简体中文和英文通用识别库的,可以手动下载扩展包,扩展包内置了繁体中文、英文、日文、韩文、俄语、德文、法文,也可以手动添加 PP-OCR 模型库。