Umi-OCR:免费,开源,可批量的离线OCR工具

Umi-OCR是什么?

Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码,内置多国语言库等功能,具有高精度识别、离线运行、多语言支持、高效批处理等优势。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR功能特点

  • 离线运行:完全离线使用,无需网络连接,保护用户隐私。

  • 多语言支持:内置多国语言库,支持多种语言的文字识别。

  • 多种识别功能:

  • 截图 OCR:支持屏幕截图、粘贴图片进行文字识别。

  • 批量 OCR:可批量导入图片进行文字识别,支持多种图片格式。

  • PDF 识别:支持从 PDF 文档中提取文字,可排除页眉、页脚等。

  • 二维码识别:支持扫码和生成二维码。

  • 公式识别:支持数学公式识别(测试中)。

  • 文本后处理:支持对识别结果进行排版整理,排除干扰文字。

  • 灵活调用:支持命令行和 HTTP 接口调用,方便开发者集成。

Umi-OCR技术特性

  • 高精度识别:内置多种语言模型,支持简/繁中文、英文、日文、韩文及常见欧洲语言,兼容混合排版文本识别。

  • 复杂版式解析:精准识别竖排文字、表格和简单数学公式。

  • 低质量图像优化:针对模糊、倾斜、低光照图片进行预处理,提升识别准确率。

  • 高效批处理与灵活输出:支持拖拽文件夹或批量导入图片,一键完成数百文件的OCR识别。

Umi-OCR:免费,开源,可批量的离线OCR软件.webp

Umi-OCR使用场景

  • 办公场景:快速提取扫描版PDF、图片报告中的文字,转换为可编辑文档。

  • 学术研究:识别外文文献、古籍资料,辅助翻译与引用。

  • 多媒体处理:为视频截图、漫画翻译、游戏字幕提供文字提取支持。

  • 自动化流程:通过命令行接口集成到其他工具链,实现批量OCR自动化。

Umi-OCR下载与使用

下载链接:

  • 蓝奏云(国内推荐,免注册/无限速):https://hiroi-sora.lanzoul.com/s/umi-ocr

  • GitHub Release:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4

安装方式:解压即用,无需安装。支持Windows 7 x64和Linux x64平台。

命令行安装:通过Scoop安装(Windows):

scoop install extras/umi-ocr

未来计划

  • 重构底层插件机制。

  • 添加在线OCR API插件。

  • 实现独立的数学公式识别插件。

  • 支持图片翻译和离线翻译。

  • 兼容MacOS和更多Linux发行版

前两天介绍的一个olmOCR也不错,只要测重PDF的转换,也可以试下。

收藏
最新工具
Shell Shockers
Shell Shockers

一款多人在线的第一人称射击游戏,玩家操控各种“武装鸡蛋”在竞技场...

Sheet0
Sheet0

一个L4级 Data Agent工具,用户只需输入需求指令,系统...

DrFonts
DrFonts

一个AI字体生成工具,它能把手写的PNG图片,比如纸上的字稿,自...

Coding Adventure
Coding Adventure

一个面向小学三年级到初中学生的游戏化编程学习平台。学生用真实编程...

Vert.sh
Vert.sh

一款完全免费、开源的文件转换工具,支持图片、音频、文档的本地处理...

Windrecorder
Windrecorder

捕风记录仪,一款开源的屏幕录制与检索工具,它记录屏幕内容来实现记...

Custom Cursor
Custom Cursor

一个能让你拥有个性化光标的网站。Custom Cursor网站有...

橙子8设计
橙子8设计

一站式AI电商图片制作平台,专为电商和跨境卖家服务。不用专业设计...

Sandspiel
Sandspiel

一款基于细胞自动机和实时物理的开源像素沙盘游戏,玩家可以在虚拟沙...

印象地图
印象地图

这是个可以帮你记住全国省市位置的测试工具。打开网站就能用,选个模...