Jelajahi Sumber

修复一个span可能没有content导致的问题

赵小蒙 1 tahun lalu
induk
melakukan
00f3e329d9
1 mengubah file dengan 2 tambahan dan 0 penghapusan
  1. 2 0
      magic_pdf/dict2md/ocr_mkcontent.py

+ 2 - 0
magic_pdf/dict2md/ocr_mkcontent.py

@@ -10,6 +10,8 @@ def mk_nlp_markdown(pdf_info_dict: dict):
             for line in block['lines']:
                 line_text = ''
                 for span in line['spans']:
+                    if not span.get('content'):
+                        continue
                     content = span['content'].replace('$', '\$')  # 转义$
                     if span['type'] == 'inline_equation':
                         content = f"${content}$"