离线图片转文字 OCR 工具：Umi-OCR

Umi-OCR 是一款开源、免费、高效、强悍的离线 OCR 文字识别工具，支持截图识别、批量导入图片识别，还可以对识别的文字进行排版，在日常工作中非常实用。虽然你可能一段时间用不到这个工具，但是绝对值得收藏，妥妥的生产力工具。

Umi-OCR 的特点

对识别结果进行文字排版，这个非常实用，我在测试的过程中，尝试使用了“多行-自然段”的情景，可以对文字按自然段排版，最接近真实的使用环境。支持以下几种排版方式，竖排还支持从左到右或者从右到左。

单行：合并同一行的文字，适合绝大部分情景。

多行-自然段：智能识别、合并属于同一段落的文字，适合绝大部分情景。

多行-代码段：尽可能还原原始排版的缩进与空格。适合识别代码片段，或需要保留空格的场景。

竖排：适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

可以设置一个或多个的矩形框，在执行批量 OCR 的时候，这些区域会被排除。

注意：因为忽略区域是针对批量图片 OCR 处理而设置的，所以只针对一种分辨率生效。假如配置的分辨率是 1920×1080，那么批量识别图片时，只有符合 1920×1080 的图片才会排除干扰文本，1920×1081 的图片中的文字会全部输出。

V1.3 版在下载的时候可以下载多国语言整合版，如果下载的是简体中文和英文通用识别库的，可以手动下载扩展包，扩展包内置了繁体中文、英文、日文、韩文、俄语、德文、法文，也可以手动添加 PP-OCR 模型库。