Răsfoiți Sursa

refactor(pdf_parse): adjust line count threshold for layoutreader

- Lower the line count threshold from 316 to 200 to ensure compatibility
- This change aims to prevent potential issues with layoutreader's maximum line support
myhloli 1 an în urmă
părinte
comite
5936684fd8
1 a modificat fișierele cu 1 adăugiri și 1 ștergeri
  1. 1 1
      magic_pdf/pdf_parse_union_core_v2.py

+ 1 - 1
magic_pdf/pdf_parse_union_core_v2.py

@@ -298,7 +298,7 @@ def sort_lines_by_model(fix_blocks, page_w, page_h, line_height):
                 block['lines'].append({'bbox': line, 'spans': []})
             page_line_list.extend(lines)
 
-    if len(page_line_list) > 316:  # layoutreader最高支持512line
+    if len(page_line_list) > 200:  # layoutreader最高支持512line
         return None
 
     # 使用layoutreader排序