首页 > Ai资讯 > Ai产品

Umi-OCR:免费，开源，可批量的离线OCR工具

映技派于2025-03-05发布在Ai产品

Umi-OCR是什么？

Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具，支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码，内置多国语言库等功能，具有高精度识别、离线运行、多语言支持、高效批处理等优势。

Umi-OCR:免费，开源，可批量的离线OCR软件.webp

Umi-OCR功能特点

离线运行：完全离线使用，无需网络连接，保护用户隐私。
多语言支持：内置多国语言库，支持多种语言的文字识别。
多种识别功能：

截图 OCR：支持屏幕截图、粘贴图片进行文字识别。
批量 OCR：可批量导入图片进行文字识别，支持多种图片格式。
PDF 识别：支持从 PDF 文档中提取文字，可排除页眉、页脚等。

二维码识别：支持扫码和生成二维码。
公式识别：支持数学公式识别（测试中）。
文本后处理：支持对识别结果进行排版整理，排除干扰文字。
灵活调用：支持命令行和 HTTP 接口调用，方便开发者集成。

Umi-OCR技术特性

高精度识别：内置多种语言模型，支持简/繁中文、英文、日文、韩文及常见欧洲语言，兼容混合排版文本识别。
复杂版式解析：精准识别竖排文字、表格和简单数学公式。
低质量图像优化：针对模糊、倾斜、低光照图片进行预处理，提升识别准确率。
高效批处理与灵活输出：支持拖拽文件夹或批量导入图片，一键完成数百文件的OCR识别。

Umi-OCR:免费，开源，可批量的离线OCR软件.webp

Umi-OCR使用场景

办公场景：快速提取扫描版PDF、图片报告中的文字，转换为可编辑文档。
学术研究：识别外文文献、古籍资料，辅助翻译与引用。
多媒体处理：为视频截图、漫画翻译、游戏字幕提供文字提取支持。
自动化流程：通过命令行接口集成到其他工具链，实现批量OCR自动化。

Umi-OCR下载与使用

下载链接：

蓝奏云（国内推荐，免注册/无限速）：https://hiroi-sora.lanzoul.com/s/umi-ocr
GitHub Release：https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4

安装方式：解压即用，无需安装。支持Windows 7 x64和Linux x64平台。

命令行安装：通过Scoop安装（Windows）：

scoop install extras/umi-ocr

未来计划

重构底层插件机制。
添加在线OCR API插件。
实现独立的数学公式识别插件。
支持图片翻译和离线翻译。
兼容MacOS和更多Linux发行版

前两天介绍的一个olmOCR也不错，只要测重PDF的转换，也可以试下。

MTranServer：一个超低资源消耗超快的离线翻译服务器开源项目

DiffRhythm:全球首个基于扩散模型的端到端音乐生成工具

Nanonets-OCR-s：能把图片里的表格转换成

Nanonets-OCR-s：能把图片里的表格转换成

2025-06-14

No-OCR：一款不需要OCR文本提取的文档处理工具

No-OCR：一款不需要OCR文本提取的文档处理工具

2025-04-23

PDF Document Layout Analys

PDF Document Layout Analys

2025-04-10

Versatile-OCR-Program：能够从复

Versatile-OCR-Program：能够从复

2025-04-08

OCRmyPDF本地部署及使用教程

OCRmyPDF本地部署及使用教程

2025-04-05

Mistral OCR：最强文档识别OCR模型，精确

Mistral OCR：最强文档识别OCR模型，精确

2025-03-07

最新工具

Shell Shockers

一款多人在线的第一人称射击游戏，玩家操控各种“武装鸡蛋”在竞技场...

Sheet0

一个L4级 Data Agent工具，用户只需输入需求指令，系统...

DrFonts

一个AI字体生成工具，它能把手写的PNG图片，比如纸上的字稿，自...

Coding Adventure

一个面向小学三年级到初中学生的游戏化编程学习平台。学生用真实编程...

Vert.sh

一款完全免费、开源的文件转换工具，支持图片、音频、文档的本地处理...

Windrecorder

捕风记录仪，一款开源的屏幕录制与检索工具，它记录屏幕内容来实现记...

Custom Cursor

一个能让你拥有个性化光标的网站。Custom Cursor网站有...

橙子8设计

一站式AI电商图片制作平台，专为电商和跨境卖家服务。不用专业设计...

Sandspiel

一款基于细胞自动机和实时物理的开源像素沙盘游戏，玩家可以在虚拟沙...

印象地图

这是个可以帮你记住全国省市位置的测试工具。打开网站就能用，选个模...

用户登录