Umi-OCR是一款免费,开源,可批量的离线OCR软件,适用于 Windows10,11 平台。
可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
Umi-OCR 软件本体含 简体中文&英文 识别库。
配套 多国语言识别扩展包 可导入 繁中,日,韩,俄,德,法 识别库,请按需下载。
来自果核网友@奔跑的小蚂蚁 推荐
软件特点
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
软件截图
更新日志
新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
新增:Esc键隐藏主窗口。 (#652)
新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
新增:命令行指令 --reload ,用于重新加载配置文件。
修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
修复:Linux版本截图后,主窗口的位置与操作前不一致。
优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言:俄语 Português ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。
下载地址
添加多国语言:下载 [Umi-OCR 多国语言识别扩展包] ,拷贝到软件目录即可。
https://pan.xunlei.com/s/VOMF47SL6FMC7x8oNL9nbBbnA1?pwd=xxdm#
https://pan.quark.cn/s/5aeb6fed4d9e
已高速(如有密码:3519)http://ct.ghpym.com/d/7369060-52346863-656d68

普通用户每天也提供免费下载次数
评论列表(18条)
用pot可以满足我的需求了
这个对办公来说太有用了
[Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 4, 'config_path': 'models/config_chinese.txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 960}
识别不了,弹这个怎么办
已经使用PixPin和TTime来完成OCR了,非常完美
很多识别错误,不太好用
能否增加v2版本两个引擎的下载地址,官方网站我下了一天都下不下来
2.0主体:https://www.123pan.com/s/eTQ9-BvaUh.html
今天更新1.3.7了
微信飞书自带的OCR挺好用的
PC上没法用吧?
win10 老坛酸菜版 1809 提示启动引擎失败
CPU无AVX指令集的,就不要下载了。
居然要AVX吗....
相比PandaOCR识别率很低,错误很多。
powertoys 也有OCR哦 ! 并且支持多语言 识别完直接放你剪贴板 直接粘贴就看到了
已安装,无法使用
语言拓展包没有哎,是不是忘记传了
感谢反馈,已重传