|
|
@@ -321,7 +321,7 @@ TODO
|
|
|
- 漫画书、艺术图册、小学教材、习题尚不能很好解析
|
|
|
- 在一些公式密集的PDF上强制启用OCR效果会更好
|
|
|
- 如果您要处理包含大量公式的pdf,强烈建议开启OCR功能。使用pymuPDF提取文字的时候会出现文本行互相重叠的情况导致公式插入位置不准确。
|
|
|
-- **表格识别**目前处于测试阶段,识别速度较慢,识别准确度有待提升。以下是我们在Ubuntu 22.04 LTS + NVIDIA GeForce RTX 4090环境下的一些性能测试结果,可供参考。
|
|
|
+- **表格识别**目前处于测试阶段,识别速度较慢,识别准确度有待提升。以下是我们在Ubuntu 22.04 LTS + Intel(R) Xeon(R) Platinum 8352V CPU @ 2.10GHz + NVIDIA GeForce RTX 4090环境下的一些性能测试结果,可供参考。
|
|
|
|
|
|
| 表格大小 | 解析耗时 |
|
|
|
|---------------|----------------------------|
|