@@ -304,8 +304,9 @@ class TableComparator:
best_header_row = 0
best_score = 0
-
- for row_idx, row in enumerate(table[:5]): # 只检查前5行
+
+ # 如果表格行数小于10,取全部行进行检测,如果大于10,取前10行
+ for row_idx, row in enumerate(table[:10]):
if not row:
continue
@@ -93,7 +93,7 @@ class TextMatcher:
# 长度比例检查 - 避免长度差异过大的匹配
length_ratio = min(len(target_text), len(box_text)) / max(len(target_text), len(box_text))
- if length_ratio < 0.3: # 长度差异超过70%则跳过
+ if length_ratio < 0.35: # 长度差异超过1/3则跳过
# 子串检查