eSearch

eSearch

一款开源跨平台工具,能截屏、OCR 识别、搜索、翻译、贴图、以图搜图、录屏,支持 Windows、macOS、Linux 系统,适合在电脑上处理信息提取、翻译和对照查看这类工作。

#创作工具 #直播录屏
收藏

eSearch简介

eSearch 是一款开源跨平台工具,能截屏、OCR 识别、搜索、翻译、贴图、以图搜图、录屏,支持 Windows、macOS、Linux 系统。桌面端用 Electron 开发,离线 OCR 靠 PaddleOCR,适合在电脑上处理信息提取、翻译和对照查看这类工作。

eSearch - 识屏 · 搜索

eSearch主要功能

  • 截屏与编辑:能框选裁切、选窗口或控件、长截屏(滚动截屏)、多屏分别截屏,还有取色器、放大镜、画笔和几何形状工具,可局部打马赛克或调色彩,有历史记录,能快速截屏到剪贴板或指定目录。

  • OCR 识别:默认用本地 PaddleOCR,也能选在线 OCR(比如百度 OCR,得有 API Key 和 Secret Key)。支持表格、公式识别,也能用在线或离线的自定义模型与字典。

  • 搜索与翻译:能对选中的文本或者 OCR 结果进行搜索,可自己设置多个搜索和翻译引擎,支持自动翻译和结果汇总。

  • 以图搜图:把截图传上去找相似的图。

  • 贴图与屏幕钉住:把截图固定在屏幕上,能调透明度、置顶,还能让鼠标穿透。

  • 录屏:能全屏或者选区域录制,支持显示按键和光标提示,能分段录,也能录音频和摄像头画面。

  • 其他:能识别二维码,常驻托盘,可设置快捷键,支持 Wayland 桌面。

eSearch安装与获取

  • 官方渠道:去 GitHub Releases 下载对应系统的安装包,也能到官网找最新版本。

  • 包管理器:

  • Windows:用 winget 安装,命令是 winget install esearch。

  • Arch Linux:在 AUR 里搜 e - search 或者 e - search - git 安装。

  • 源码构建:

  • 先克隆仓库并装依赖,命令是 git clone https://github.com/xushengfeng/eSearch.git && cd eSearch && npm install。

  • 再编译打包,命令是 npm run dist,生成的东西在 build 目录。

  • 运行或调试,命令是 npm run start或者 npm run dev。

  • Linux 提示:GNOME 桌面可能得装 appindicator 扩展,这样才能正常显示托盘图标。

eSearch常用操作

  • 启动与托盘:第一次打开后会常驻托盘,能在设置里改语言、字体(比如 FiraCode)、快捷键等。

  • 常用快捷键(:

  • Alt + C:自动识别,框选后进行 OCR 等操作。

  • Alt + S:选中搜索。

  • Alt + B:剪贴板搜索。

  • Alt + Q:快速截屏。

  • OCR 与翻译:截屏后能直接用离线 OCR;要是想用在线 OCR,就填入百度 OCR 的 API Key 和 Secret Key,然后在设置里启用,识别结果能一键搜索或翻译。

  • 贴图与屏幕钉住:把截图固定在屏幕角落,能调透明度和大小,方便对照编辑或者演示。

  • 录屏:能选区域或者全屏录,能开按键和光标提示,支持录音频和摄像头画面。

  • 命令行:

  • esearch - c:截屏搜索。

  • esearch - s:选中搜索。

  • esearch - b:剪贴板搜索。

  • esearch - a:自动识别。

  • esearch - q:快速截屏。

(要是找不到命令,试试 e - search)

eSearch使用方法

先去 eSearch 官网或者 GitHub 仓库下载安装包,按说明安装。打开后在启动器里找到 eSearch,它会显示托盘图标。默认快捷键是 Alt + C,也能在设置里自己改。想截屏就按快捷键,然后选截屏区域,进行裁剪、标注等操作。截屏后点 OCR 识别按钮就能识别图片里的文字。识别出文字后,点搜索或翻译按钮就能进行相关操作。截屏或者选好图片后,点贴图按钮就能把图片贴到屏幕上。

关键问题

  • 问:eSearch 的 OCR 功能在隐私性和识别能力上有哪些核心优势,适合哪些用户场景?

    eSearch 的 OCR 功能优势主要有两方面。隐私性方面,它在本地运行,不用联网,也不会把数据传到服务器,能防止敏感文本,像工作文档、个人信息泄露,适合处理涉密或者隐私文本的用户。识别能力方面,默认用 PaddleOCR v4 模型,也能下载 v5 模型,能识别 1.5 万 + 个字符,覆盖多种语言,还有布局识别、ai 辅助校对、同步选择校对等功能,能保证识别准确,排版也合理。适合跨境办公要处理多语言文档的人、学生或研究员要离线识别纸质文档、法务或财务从业者要保护客户信息、学习者要用 OCR 学语言,比如识别外文资料导入 Anki这些场景。

  • 问:eSearch 的屏幕录制与截图功能相比普通工具,在编辑灵活性上有哪些独特设计?

    和普通工具比,eSearch 在编辑灵活性上有三个独特设计。一是屏幕录制能逐帧精细控制,能单独对某一帧加速、删除或者调整,还能把录制结果转成 mp4、gif、webm 等多种格式,能满足视频演示到动图分享等不同需求,普通工具大多只能基础剪辑(比如裁剪时长),没有逐帧控制。二是截图全场景覆盖且高级编辑功能多,截图类型有滚动拼接、任意形状、普通截图,几乎能满足所有截图需求;编辑时不仅能快速标记,还能给图片加圆角、阴影、背景,有马赛克、模糊等滤镜,普通工具大多只能基础标记,缺少高级美化和信息隐藏功能。三是跨功能协同编辑,截图能和 OCR、翻译功能联动,截图后能直接 OCR 识别或者翻译,识别文本能通过同步选择校对和原图对比,普通工具大多要单独打开 OCR 或者翻译软件处理,效率低。

  • 问:eSearch免费版已能满足哪些核心需求?

    eSearch免费版能满足不少核心需求,基础 OCR 方面,能离线识别文本,在线试用 0 元 / 10000 字且无使用限制,还有拼写检查、自动排版功能,能满足日常文本识别;常规屏幕操作方面,能普通截图、基础屏幕录制、屏幕翻译,翻译结果能复制或者保存到文件 / Anki;个性化基础设置方面,能自定义 63 种快捷键、调整界面字体和颜色、设置深色模式,能提升操作效率和视觉体验;基础辅助功能方面,有贴图、错误反馈,能满足日常使用的附加需求。

与eSearch相关工具