Umi-OCR:免费,开源,可批量的离线OCR工具

Umi-OCR是什么?

Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码,内置多国语言库等功能,具有高精度识别、离线运行、多语言支持、高效批处理等优势。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR功能特点

  • 离线运行:完全离线使用,无需网络连接,保护用户隐私。

  • 多语言支持:内置多国语言库,支持多种语言的文字识别。

  • 多种识别功能:

  • 截图 OCR:支持屏幕截图、粘贴图片进行文字识别。

  • 批量 OCR:可批量导入图片进行文字识别,支持多种图片格式。

  • PDF 识别:支持从 PDF 文档中提取文字,可排除页眉、页脚等。

  • 二维码识别:支持扫码和生成二维码。

  • 公式识别:支持数学公式识别(测试中)。

  • 文本后处理:支持对识别结果进行排版整理,排除干扰文字。

  • 灵活调用:支持命令行和 HTTP 接口调用,方便开发者集成。

Umi-OCR技术特性

  • 高精度识别:内置多种语言模型,支持简/繁中文、英文、日文、韩文及常见欧洲语言,兼容混合排版文本识别。

  • 复杂版式解析:精准识别竖排文字、表格和简单数学公式。

  • 低质量图像优化:针对模糊、倾斜、低光照图片进行预处理,提升识别准确率。

  • 高效批处理与灵活输出:支持拖拽文件夹或批量导入图片,一键完成数百文件的OCR识别。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR使用场景

  • 办公场景:快速提取扫描版PDF、图片报告中的文字,转换为可编辑文档。

  • 学术研究:识别外文文献、古籍资料,辅助翻译与引用。

  • 多媒体处理:为视频截图、漫画翻译、游戏字幕提供文字提取支持。

  • 自动化流程:通过命令行接口集成到其他工具链,实现批量OCR自动化。

Umi-OCR下载与使用

下载链接:

  • 蓝奏云(国内推荐,免注册/无限速):https://hiroi-sora.lanzoul.com/s/umi-ocr

  • GitHub Release:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4

安装方式:解压即用,无需安装。支持Windows 7 x64和Linux x64平台。

命令行安装:通过Scoop安装(Windows):

scoop install extras/umi-ocr

未来计划

  • 重构底层插件机制。

  • 添加在线OCR API插件。

  • 实现独立的数学公式识别插件。

  • 支持图片翻译和离线翻译。

  • 兼容MacOS和更多Linux发行版

前两天介绍的一个olmOCR也不错,只要测重PDF的转换,也可以试下。

收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...