Browse Source

refactor(magic_pdf): update invalid character detection logic

- Uncomment detect_invalid_chars_by_pymupdf function call
- Comment out detect_invalid_chars function call
myhloli 9 tháng trước cách đây
mục cha
commit
5aa809ff14
1 tập tin đã thay đổi với 2 bổ sung2 xóa
  1. 2 2
      magic_pdf/filter/pdf_meta_scan.py

+ 2 - 2
magic_pdf/filter/pdf_meta_scan.py

@@ -323,8 +323,8 @@ def get_language(doc: fitz.Document):
 
 def check_invalid_chars(pdf_bytes):
     """乱码检测."""
-    # return detect_invalid_chars_by_pymupdf(pdf_bytes)
-    return detect_invalid_chars(pdf_bytes)
+    return detect_invalid_chars_by_pymupdf(pdf_bytes)
+    # return detect_invalid_chars(pdf_bytes)
 
 
 def pdf_meta_scan(pdf_bytes: bytes):