Procházet zdrojové kódy

fix: disable tokenizers parallelism to prevent potential issues

myhloli před 1 měsícem
rodič
revize
305e3a61e8
1 změnil soubory, kde provedl 1 přidání a 0 odebrání
  1. 1 0
      mineru/cli/common.py

+ 1 - 0
mineru/cli/common.py

@@ -20,6 +20,7 @@ from mineru.backend.vlm.vlm_analyze import aio_doc_analyze as aio_vlm_doc_analyz
 pdf_suffixes = ["pdf"]
 image_suffixes = ["png", "jpeg", "jp2", "webp", "gif", "bmp", "jpg", "tiff"]
 
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
 
 def read_fn(path):
     if not isinstance(path, Path):