Răsfoiți Sursa

Merge pull request #100 from papayalove/master

解决list识别错误
myhloli 1 an în urmă
părinte
comite
3a0a08e4d8
1 a modificat fișierele cu 2 adăugiri și 1 ștergeri
  1. 2 1
      magic_pdf/para/para_split_v2.py

+ 2 - 1
magic_pdf/para/para_split_v2.py

@@ -114,7 +114,8 @@ def __detect_list_lines(lines, new_layout_bboxes, lang):
             else:
                 layout_left = layout[0]
                 if l['bbox'][0] == layout_left:
-                    if first_char.isupper() or first_char.isdigit() or not first_char.isalnum():
+                    # if first_char.isupper() or first_char.isdigit() or not first_char.isalnum():
+                    if not first_char.isalnum():
                         line_fea_encode.append(1)
                     else:
                         line_fea_encode.append(4)