Parcourir la source

feat: 优化数据源名称生成逻辑,使用 result_dir 提高唯一性和清晰度

zhch158_admin il y a 1 semaine
Parent
commit
a8b6eabc3a
1 fichiers modifiés avec 3 ajouts et 8 suppressions
  1. 3 8
      config_manager.py

+ 3 - 8
config_manager.py

@@ -278,20 +278,15 @@ class ConfigManager:
                     # 如果未指定图片目录,使用结果目录
                     src_img_dir = str(base_dir / ocr_result.result_dir / doc_name)
                 
-                # 生成数据源名称
-                if ocr_result.description:
-                    source_name = f"{doc_name}_{ocr_result.description}"
-                else:
-                    tool_config = self.get_ocr_tool(ocr_result.tool)
-                    tool_name = tool_config.name if tool_config else ocr_result.tool
-                    source_name = f"{doc_name}_{tool_name}"
+                # 🎯 使用 result_dir 生成数据源名称(更唯一、更清晰)
+                source_name = f"{doc_name}_{ocr_result.result_dir}"
                 
                 data_source = DataSource(
                     name=source_name,
                     ocr_tool=ocr_result.tool,
                     ocr_out_dir=ocr_out_dir,
                     src_img_dir=src_img_dir,
-                    description=ocr_result.description or f"{doc_name} 使用 {ocr_result.tool}"
+                    description=ocr_result.description or ocr_result.result_dir
                 )
                 
                 data_sources.append(data_source)