Bläddra i källkod

Merge pull request #100 from papayalove/master

解决list识别错误
myhloli 1 år sedan
förälder
incheckning
3a0a08e4d8
1 ändrade filer med 2 tillägg och 1 borttagningar
  1. 2 1
      magic_pdf/para/para_split_v2.py

+ 2 - 1
magic_pdf/para/para_split_v2.py

@@ -114,7 +114,8 @@ def __detect_list_lines(lines, new_layout_bboxes, lang):
             else:
                 layout_left = layout[0]
                 if l['bbox'][0] == layout_left:
-                    if first_char.isupper() or first_char.isdigit() or not first_char.isalnum():
+                    # if first_char.isupper() or first_char.isdigit() or not first_char.isalnum():
+                    if not first_char.isalnum():
                         line_fea_encode.append(1)
                     else:
                         line_fea_encode.append(4)