eSearch

一款开源跨平台工具，能截屏、OCR 识别、搜索、翻译、贴图、以图搜图、录屏，支持 Windows、macOS、Linux 系统，适合在电脑上处理信息提取、翻译和对照查看这类工作。

#创作工具 #直播录屏

eSearch简介

eSearch 是一款开源跨平台工具，能截屏、OCR 识别、搜索、翻译、贴图、以图搜图、录屏，支持 Windows、macOS、Linux 系统。桌面端用 Electron 开发，离线 OCR 靠 PaddleOCR，适合在电脑上处理信息提取、翻译和对照查看这类工作。

eSearch - 识屏 · 搜索

eSearch主要功能

截屏与编辑：能框选裁切、选窗口或控件、长截屏（滚动截屏）、多屏分别截屏，还有取色器、放大镜、画笔和几何形状工具，可局部打马赛克或调色彩，有历史记录，能快速截屏到剪贴板或指定目录。
OCR 识别：默认用本地 PaddleOCR，也能选在线 OCR（比如百度 OCR，得有 API Key 和 Secret Key）。支持表格、公式识别，也能用在线或离线的自定义模型与字典。
搜索与翻译：能对选中的文本或者 OCR 结果进行搜索，可自己设置多个搜索和翻译引擎，支持自动翻译和结果汇总。
以图搜图：把截图传上去找相似的图。
贴图与屏幕钉住：把截图固定在屏幕上，能调透明度、置顶，还能让鼠标穿透。
录屏：能全屏或者选区域录制，支持显示按键和光标提示，能分段录，也能录音频和摄像头画面。
其他：能识别二维码，常驻托盘，可设置快捷键，支持 Wayland 桌面。

eSearch安装与获取

官方渠道：去 GitHub Releases 下载对应系统的安装包，也能到官网找最新版本。
包管理器：

Windows：用 winget 安装，命令是 winget install esearch。
Arch Linux：在 AUR 里搜 e - search 或者 e - search - git 安装。

源码构建：

先克隆仓库并装依赖，命令是 git clone https://github.com/xushengfeng/eSearch.git && cd eSearch && npm install。
再编译打包，命令是 npm run dist，生成的东西在 build 目录。
运行或调试，命令是 npm run start或者 npm run dev。

Linux 提示：GNOME 桌面可能得装 appindicator 扩展，这样才能正常显示托盘图标。

eSearch常用操作

启动与托盘：第一次打开后会常驻托盘，能在设置里改语言、字体（比如 FiraCode）、快捷键等。
常用快捷键（：

Alt + C：自动识别，框选后进行 OCR 等操作。
Alt + S：选中搜索。
Alt + B：剪贴板搜索。
Alt + Q：快速截屏。

OCR 与翻译：截屏后能直接用离线 OCR；要是想用在线 OCR，就填入百度 OCR 的 API Key 和 Secret Key，然后在设置里启用，识别结果能一键搜索或翻译。
贴图与屏幕钉住：把截图固定在屏幕角落，能调透明度和大小，方便对照编辑或者演示。
录屏：能选区域或者全屏录，能开按键和光标提示，支持录音频和摄像头画面。
命令行：

esearch - c：截屏搜索。
esearch - s：选中搜索。
esearch - b：剪贴板搜索。
esearch - a：自动识别。
esearch - q：快速截屏。

（要是找不到命令，试试 e - search）

eSearch使用方法

先去 eSearch 官网或者 GitHub 仓库下载安装包，按说明安装。打开后在启动器里找到 eSearch，它会显示托盘图标。默认快捷键是 Alt + C，也能在设置里自己改。想截屏就按快捷键，然后选截屏区域，进行裁剪、标注等操作。截屏后点 OCR 识别按钮就能识别图片里的文字。识别出文字后，点搜索或翻译按钮就能进行相关操作。截屏或者选好图片后，点贴图按钮就能把图片贴到屏幕上。

关键问题

问：eSearch 的 OCR 功能在隐私性和识别能力上有哪些核心优势，适合哪些用户场景？
eSearch 的 OCR 功能优势主要有两方面。隐私性方面，它在本地运行，不用联网，也不会把数据传到服务器，能防止敏感文本，像工作文档、个人信息泄露，适合处理涉密或者隐私文本的用户。识别能力方面，默认用 PaddleOCR v4 模型，也能下载 v5 模型，能识别 1.5 万 + 个字符，覆盖多种语言，还有布局识别、ai 辅助校对、同步选择校对等功能，能保证识别准确，排版也合理。适合跨境办公要处理多语言文档的人、学生或研究员要离线识别纸质文档、法务或财务从业者要保护客户信息、学习者要用 OCR 学语言，比如识别外文资料导入 Anki这些场景。
问：eSearch 的屏幕录制与截图功能相比普通工具，在编辑灵活性上有哪些独特设计？
和普通工具比，eSearch 在编辑灵活性上有三个独特设计。一是屏幕录制能逐帧精细控制，能单独对某一帧加速、删除或者调整，还能把录制结果转成 mp4、gif、webm 等多种格式，能满足视频演示到动图分享等不同需求，普通工具大多只能基础剪辑（比如裁剪时长），没有逐帧控制。二是截图全场景覆盖且高级编辑功能多，截图类型有滚动拼接、任意形状、普通截图，几乎能满足所有截图需求；编辑时不仅能快速标记，还能给图片加圆角、阴影、背景，有马赛克、模糊等滤镜，普通工具大多只能基础标记，缺少高级美化和信息隐藏功能。三是跨功能协同编辑，截图能和 OCR、翻译功能联动，截图后能直接 OCR 识别或者翻译，识别文本能通过同步选择校对和原图对比，普通工具大多要单独打开 OCR 或者翻译软件处理，效率低。
问：eSearch免费版已能满足哪些核心需求？
eSearch免费版能满足不少核心需求，基础 OCR 方面，能离线识别文本，在线试用 0 元 / 10000 字且无使用限制，还有拼写检查、自动排版功能，能满足日常文本识别；常规屏幕操作方面，能普通截图、基础屏幕录制、屏幕翻译，翻译结果能复制或者保存到文件 / Anki；个性化基础设置方面，能自定义 63 种快捷键、调整界面字体和颜色、设置深色模式，能提升操作效率和视觉体验；基础辅助功能方面，有贴图、错误反馈，能满足日常使用的附加需求。