Преглед на файлове

拼接markdown时,如果para_text为空则跳过拼接

赵小蒙 преди 1 година
родител
ревизия
473a0a7de0
променени са 1 файла, в които са добавени 4 реда и са изтрити 1 реда
  1. 4 1
      magic_pdf/dict2md/ocr_mkcontent.py

+ 4 - 1
magic_pdf/dict2md/ocr_mkcontent.py

@@ -122,7 +122,10 @@ def ocr_mk_mm_markdown_with_para_core(paras_of_layout, mode):
                             pass
                     if content != '':
                         para_text += content + ' '
-            page_markdown.append(para_text.strip() + '  ')
+            if para_text.strip() == '':
+                continue
+            else:
+                page_markdown.append(para_text.strip() + '  ')
     return page_markdown