Browse Source

Merge pull request #1222 from myhloli/dev

fix(dict2md): add space for inline equations in CJK contexts
Xiaomeng Zhao 11 tháng trước cách đây
mục cha
commit
f58a7a7d77
1 tập tin đã thay đổi với 2 bổ sung2 xóa
  1. 2 2
      magic_pdf/dict2md/ocr_mkcontent.py

+ 2 - 2
magic_pdf/dict2md/ocr_mkcontent.py

@@ -165,8 +165,8 @@ def merge_para_with_text(para_block):
             if content:
                 langs = ['zh', 'ja', 'ko']
                 # logger.info(f'block_lang: {block_lang}, content: {content}')
-                if block_lang in langs: # 中文/日语/韩文语境下,换行不需要空格分隔
-                    if j == len(line['spans']) - 1:
+                if block_lang in langs: # 中文/日语/韩文语境下,换行不需要空格分隔,但是如果是行内公式结尾,还是要加空格
+                    if j == len(line['spans']) - 1 and span_type not in [ContentType.InlineEquation]:
                         para_text += content
                     else:
                         para_text += f'{content} '