Explorar el Código

Merge pull request #1064 from myhloli/dev

fix(pdf_parse): improve OCR result handling
Xiaomeng Zhao hace 1 año
padre
commit
b936cb0c25
Se han modificado 1 ficheros con 1 adiciones y 1 borrados
  1. 1 1
      magic_pdf/pdf_parse_union_core_v2.py

+ 1 - 1
magic_pdf/pdf_parse_union_core_v2.py

@@ -222,7 +222,7 @@ def txt_spans_extract_v2(pdf_page, spans, all_bboxes, all_discarded_blocks, lang
             ocr_res = ocr_model.ocr(span_img, det=False)
             # logger.info(f"ocr_res: {ocr_res}")
             # logger.info(f"empty_span: {span}")
-            if len(ocr_res) > 0:
+            if ocr_res and len(ocr_res) > 0:
                 if len(ocr_res[0]) > 0:
                     ocr_text, ocr_score = ocr_res[0][0]
                     if ocr_score > 0.5 and len(ocr_text) > 0: