浏览代码

拼接markdown时,如果para_text为空则跳过拼接

赵小蒙 1 年之前
父节点
当前提交
473a0a7de0
共有 1 个文件被更改,包括 4 次插入1 次删除
  1. 4 1
      magic_pdf/dict2md/ocr_mkcontent.py

+ 4 - 1
magic_pdf/dict2md/ocr_mkcontent.py

@@ -122,7 +122,10 @@ def ocr_mk_mm_markdown_with_para_core(paras_of_layout, mode):
                             pass
                     if content != '':
                         para_text += content + ' '
-            page_markdown.append(para_text.strip() + '  ')
+            if para_text.strip() == '':
+                continue
+            else:
+                page_markdown.append(para_text.strip() + '  ')
     return page_markdown