Pārlūkot izejas kodu

优化可用OCR文件查找逻辑,仅添加符合特定命名规则的JSON文件

zhch158_admin 1 mēnesi atpakaļ
vecāks
revīzija
8f38c06a62
1 mainītis faili ar 2 papildinājumiem un 1 dzēšanām
  1. 2 1
      ocr_validator_utils.py

+ 2 - 1
ocr_validator_utils.py

@@ -708,7 +708,8 @@ def find_available_ocr_files(ocr_out_dir: str) -> List[str]:
         if search_dir.exists():
             # 递归搜索JSON文件
             for json_file in search_dir.rglob("*.json"):
-                available_files.append(str(json_file))
+                if re.match(r'.*_page_\d+\.json$', json_file.name, re.IGNORECASE):
+                    available_files.append(str(json_file))
     # 去重并排序
     # available_files = sorted(list(set(available_files)))
     # 解析文件名并提取页码信息