从各种不同类型的文件中提取文本
https://txtract.readthedocs.io/
许可证: MIT
公式 JSON API: /api/formula/txtract.json
公式代码: txtract.rb
在 GitHub
提供瓶装(二进制包)安装支持
苹果硅 | sonoma | ✅ |
---|---|---|
ventura | ✅ | |
monterey | ✅ | |
Intel | sonoma | ✅ |
ventura | ✅ | |
monterey | ✅ | |
64位linux | ✅ |
当前版本
稳定版 | ✅ | 1.6.5 |
依赖
antiword | 0.37 | 读取 Word (.doc) 文件的实用程序 |
flac | 1.4.3 | 免费无损音频编解码器 |
pillow | 10.4.0 | 友好的 PIL 分支(Python 图像库) |
poppler | 24.04.0 | PDF 渲染库(基于 xpdf-3.0 代码库) |
[email protected] | 3.12.4 | 解释性、交互式、面向对象的编程语言 |
swig | 4.2.1 | 为 C/C++ 代码生成脚本接口 |
tesseract | 5.4.1 | OCR(光学字符识别)引擎 |
unrtf | 0.21.10 | RTF 转换为其他格式转换器 |
分析
安装(30天) | |
---|---|
txtract |
7 |
请求安装(30天) | |
txtract |
7 |
构建错误(30天) | |
txtract |
0 |
安装(90天) | |
txtract |
126 |
请求安装(90天) | |
txtract |
126 |
安装(365天) | |
txtract |
1,354 |
txtract --HEAD |
1 |
请求安装(365天) | |
txtract |
1,354 |
txtract --HEAD |
1 |