ocrmypdf

安装命令
brew install ocrmypdf

为扫描的 PDF 文件添加 OCR 文本层

https://ocrmypdf.readthedocs.io/zh/latest/

许可:MPL-2.0

公式 JSON API: /api/formula/ocrmypdf.json

公式代码: ocrmypdf.rb 在 GitHub

提供瓶装(二进制包)安装支持

Apple Silicon sonoma
ventura
monterey
Intel sonoma
ventura
monterey
64位 linux

当前版本

稳定版 16.4.3

依赖

cryptography 43.0.0 Python 的加密算法和基本原语
freetype 2.13.2 用于渲染字体的软件库
ghostscript 10.03.1 PostScript 和 PDF 解释器
img2pdf 0.5.1 通过直接 JPEG 包含将图像转换为 PDF
jbig2enc 0.29 JBIG2 编码器(用于单色文档)
libheif 1.18.1 ISO/IEC 23008-12:2017 HEIF 文件格式解码器和编码器
libpng 1.6.43 操作 PNG 图像的库
pillow 10.4.0 友好的 PIL 分支(Python Imaging Library)
pngquant 3.0.3 PNG 图像优化实用程序
pybind11 2.13.1 C++11 和 Python 之间的无缝互操作性
[email protected] 3.12.4 解释性、交互式、面向对象编程语言
qpdf 11.9.1 用于转换和检查 PDF 文件的工具
tesseract 5.4.1 OCR(光学字符识别)引擎
unpaper 7.0.0 扫描/复印书籍的后期处理

从源代码构建时依赖

pkg-config 0.29.2 管理库的编译和链接标志

分析

安装(30天)
ocrmypdf 2,790
ocrmypdf --HEAD 6
请求安装(30天)
ocrmypdf 2,788
ocrmypdf --HEAD 6
构建错误(30天)
ocrmypdf 0
安装(90天)
ocrmypdf 8,106
ocrmypdf --HEAD 21
请求安装(90天)
ocrmypdf 8,105
ocrmypdf --HEAD 21
安装(365天)
ocrmypdf 33,934
ocrmypdf --HEAD 56
请求安装(365天)
ocrmypdf 33,931
ocrmypdf --HEAD 56
Fork me on GitHub