Umi-OCR:免费,开源,可批量的离线OCR工具

Umi-OCR是什么?

Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码,内置多国语言库等功能,具有高精度识别、离线运行、多语言支持、高效批处理等优势。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR功能特点

  • 离线运行:完全离线使用,无需网络连接,保护用户隐私。

  • 多语言支持:内置多国语言库,支持多种语言的文字识别。

  • 多种识别功能:

  • 截图 OCR:支持屏幕截图、粘贴图片进行文字识别。

  • 批量 OCR:可批量导入图片进行文字识别,支持多种图片格式。

  • PDF 识别:支持从 PDF 文档中提取文字,可排除页眉、页脚等。

  • 二维码识别:支持扫码和生成二维码。

  • 公式识别:支持数学公式识别(测试中)。

  • 文本后处理:支持对识别结果进行排版整理,排除干扰文字。

  • 灵活调用:支持命令行和 HTTP 接口调用,方便开发者集成。

Umi-OCR技术特性

  • 高精度识别:内置多种语言模型,支持简/繁中文、英文、日文、韩文及常见欧洲语言,兼容混合排版文本识别。

  • 复杂版式解析:精准识别竖排文字、表格和简单数学公式。

  • 低质量图像优化:针对模糊、倾斜、低光照图片进行预处理,提升识别准确率。

  • 高效批处理与灵活输出:支持拖拽文件夹或批量导入图片,一键完成数百文件的OCR识别。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR使用场景

  • 办公场景:快速提取扫描版PDF、图片报告中的文字,转换为可编辑文档。

  • 学术研究:识别外文文献、古籍资料,辅助翻译与引用。

  • 多媒体处理:为视频截图、漫画翻译、游戏字幕提供文字提取支持。

  • 自动化流程:通过命令行接口集成到其他工具链,实现批量OCR自动化。

Umi-OCR下载与使用

下载链接:

  • 蓝奏云(国内推荐,免注册/无限速):https://hiroi-sora.lanzoul.com/s/umi-ocr

  • GitHub Release:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4

安装方式:解压即用,无需安装。支持Windows 7 x64和Linux x64平台。

命令行安装:通过Scoop安装(Windows):

scoop install extras/umi-ocr

未来计划

  • 重构底层插件机制。

  • 添加在线OCR API插件。

  • 实现独立的数学公式识别插件。

  • 支持图片翻译和离线翻译。

  • 兼容MacOS和更多Linux发行版

前两天介绍的一个olmOCR也不错,只要测重PDF的转换,也可以试下。

收藏
最新工具
易纸
易纸

一个免费的在线稿纸打印工具,支持方格纸、竖线纸、毛笔字帖、作文纸...

装个机ZhuangIt
装个机ZhuangIt

一个手把手教你自己装系统、重装电脑的实用网站,提供从备份到激活的...

PinMe
PinMe

一款简单实用的去中心化部署工具,能降低个人网站和作品展示的技术门...

RoboNeo
RoboNeo

美图公司推出的 AI 视觉工具,能通过文字交流实现修图、设计、视...

JellyMario
JellyMario

一款改自经典的《超级马里奥》的网页游戏。游戏里的角色、敌人和场景...

MyAITeachers AI吾师
MyAITeachers AI吾师

一个面向 8 岁以上学习者的AI学习辅导工具,有多位 AI 老师...

Presenton
Presenton

一个可以本地运行的开源AI PPT生成器,使用OpenAI、Ge...

Eigent AI
Eigent AI

全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分...

NB Map
NB Map

灰色执照做的免费在线三维地图生成工具。它能根据真实地形数据,做出...

AI Dungeon
AI Dungeon

一款靠AI运行的文字冒险游戏。玩家可以自己选或创建冒险场景,像幻...