为扫描的 PDF 文件添加 OCR 文本层
https://ocrmypdf.readthedocs.io/zh/latest/
许可:MPL-2.0
公式 JSON API: /api/formula/ocrmypdf.json
公式代码: ocrmypdf.rb
在 GitHub
提供瓶装(二进制包)安装支持
Apple Silicon | sonoma | ✅ |
---|---|---|
ventura | ✅ | |
monterey | ✅ | |
Intel | sonoma | ✅ |
ventura | ✅ | |
monterey | ✅ | |
64位 linux | ✅ |
当前版本
稳定版 | ✅ | 16.4.3 |
依赖
cryptography | 43.0.0 | Python 的加密算法和基本原语 |
freetype | 2.13.2 | 用于渲染字体的软件库 |
ghostscript | 10.03.1 | PostScript 和 PDF 解释器 |
img2pdf | 0.5.1 | 通过直接 JPEG 包含将图像转换为 PDF |
jbig2enc | 0.29 | JBIG2 编码器(用于单色文档) |
libheif | 1.18.1 | ISO/IEC 23008-12:2017 HEIF 文件格式解码器和编码器 |
libpng | 1.6.43 | 操作 PNG 图像的库 |
pillow | 10.4.0 | 友好的 PIL 分支(Python Imaging Library) |
pngquant | 3.0.3 | PNG 图像优化实用程序 |
pybind11 | 2.13.1 | C++11 和 Python 之间的无缝互操作性 |
[email protected] | 3.12.4 | 解释性、交互式、面向对象编程语言 |
qpdf | 11.9.1 | 用于转换和检查 PDF 文件的工具 |
tesseract | 5.4.1 | OCR(光学字符识别)引擎 |
unpaper | 7.0.0 | 扫描/复印书籍的后期处理 |
从源代码构建时依赖
pkg-config | 0.29.2 | 管理库的编译和链接标志 |
分析
安装(30天) | |
---|---|
ocrmypdf |
2,790 |
ocrmypdf --HEAD |
6 |
请求安装(30天) | |
ocrmypdf |
2,788 |
ocrmypdf --HEAD |
6 |
构建错误(30天) | |
ocrmypdf |
0 |
安装(90天) | |
ocrmypdf |
8,106 |
ocrmypdf --HEAD |
21 |
请求安装(90天) | |
ocrmypdf |
8,105 |
ocrmypdf --HEAD |
21 |
安装(365天) | |
ocrmypdf |
33,934 |
ocrmypdf --HEAD |
56 |
请求安装(365天) | |
ocrmypdf |
33,931 |
ocrmypdf --HEAD |
56 |