veket官方网站论坛

veket

 找回密码
 要注册
搜索
查看: 282|回复: 4

[下载] OCR软件gimagereader从图像和PDF文档中识别文本

[复制链接]
发表于 2023-8-22 13:26 | 显示全部楼层 |阅读模式
gImageReader是一个GUI软件,实现利用tesseract OCR引擎(Tesseract本身是命令行工具)从图像和PDF文档中识别文本。
Tesseract最初是由惠普开发的,然后在2006年开源。你可以用OCR(光学字符识别)引擎扫描图片或文件(PDF)中的文本。默认情况下,它可以检测多种语言,并且还支持通过Unicode字符进行扫描。GitHub项目网址:
https://github.com/manisandro/gImageReader
gImageReader特性
    从磁盘,扫描设备,剪贴板和屏幕截图添加PDF文档和图像支持多页的 PDF 文档自动分页检测通用图像控件可调节亮度,对比度和分辨率能够一次处理多个图像或文件支持用户手动定义和调整识别区域(也可以自动识别文字区域)识别纯文本或hOCR文档可以提取的文本进行对拼写检查可以从hOCR文档转换/导出为PDF文档将提取的文本导出为.txt文件可以识别不同的语言跨平台... ...

下载
https://www.123pan.com/s/uQCRVv-47KlA.html
链接: https://pan.baidu.com/s/18AdMCN9juk0EnMGehUWf2A 提取码: qynk
上边只集成了简体中文,需要简体中文竖行识别和繁体中文的安装下边的包:
https://www.123pan.com/s/uQCRVv-x7KlA.html
链接: https://pan.baidu.com/s/1eXNToc6UZxpWfzfCFDf26g 提取码: 2ip2
里边包含下边三个包
tesseract-ocr-chi-sim-vert_4.1.0-2_all
tesseract-ocr-chi-tra_4.1.0-2_all
tesseract-ocr-chi-tra-vert_4.1.0-2_all
若需要识别别的语言,在线安装软件里搜索添加就行了
 楼主| 发表于 2023-8-26 15:27 | 显示全部楼层
图片识别成文字的软件免费gImageReader中文版,从图像和 PDF 中提取文字
https://www.bilibili.com/video/BV1Nu4y1D7W2/
免费图片转文字的软件,图片转文字提取软件gimagereader,图像识别软件
https://www.bilibili.com/video/BV1RB4y1i7Ws/
发表于 2023-9-9 21:32 | 显示全部楼层
好用啊!
发表于 2023-9-16 09:32 | 显示全部楼层
下载
发表于 2023-9-16 22:23 | 显示全部楼层
谢谢楼主
您需要登录后才可以回帖 登录 | 要注册

本版积分规则

QQ|手机版|Archiver|veket官方网站论坛 ( 粤ICP备 11052856 )

GMT+8, 2024-5-3 17:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表