Browse Source

fix: add handling for copyright symbol in regex replacements

myhloli 5 tháng trước cách đây
mục cha
commit
1dc7d603dd

+ 1 - 0
mineru/model/mfr/unimernet/unimernet_hf/modeling_unimernet.py

@@ -349,6 +349,7 @@ REPLACEMENTS_PATTERNS = {
     re.compile(r'\\vline = '): r'\\models ',
     re.compile(r'\\vDash '): r'\\models ',
     re.compile(r'\\sq \\sqcup '): r'\\square ',
+    re.compile(r'\\copyright'): r'©',
 }
 QQUAD_PATTERN = re.compile(r'\\qquad(?!\s)')