Quellcode durchsuchen

更新清除重叠span的逻辑

赵小蒙 vor 1 Jahr
Ursprung
Commit
9cc53a5e57
1 geänderte Dateien mit 5 neuen und 4 gelöschten Zeilen
  1. 5 4
      magic_pdf/libs/boxbase.py

+ 5 - 4
magic_pdf/libs/boxbase.py

@@ -210,10 +210,11 @@ def get_minbox_if_overlap_by_ratio(bbox1, bbox2, ratio):
     area1 = (x1_max - x1_min) * (y1_max - y1_min)
     area2 = (x2_max - x2_min) * (y2_max - y2_min)
     overlap_ratio = calculate_overlap_area_2_minbox_area_ratio(bbox1, bbox2)
-    if overlap_ratio > ratio and area1 < area2:
-        return bbox1
-    elif overlap_ratio > ratio and area2 < area1:
-        return bbox2
+    if overlap_ratio > ratio:
+        if area1 <= area2:
+            return bbox1
+        else:
+            return bbox2
     else:
         return None