Преглед изворни кода

fix: update CTCLabelDecode output channels and clean up Latin dictionary

myhloli пре 3 недеља
родитељ
комит
3546766e72

+ 1 - 1
mineru/model/utils/pytorchocr/utils/resources/arch_config.yaml

@@ -526,7 +526,7 @@ latin_PP-OCRv5_rec_infer:
   Head:
     name: MultiHead
     out_channels_list:
-      CTCLabelDecode: 504
+      CTCLabelDecode: 838
     head_list:
       - CTCHead:
           Neck:

+ 545 - 211
mineru/model/utils/pytorchocr/utils/resources/dict/ppocrv5_latin_dict.txt

@@ -1,18 +1,3 @@
-!
-"
-#
-$
-%
-&
-'
-(
-)
-*
-+
-,
--
-.
-/
 0
 1
 2
@@ -23,13 +8,6 @@ $
 7
 8
 9
-:
-;
-<
-=
->
-?
-@
 A
 B
 C
@@ -56,12 +34,6 @@ W
 X
 Y
 Z
-[
-\
-]
-^
-_
-`
 a
 b
 c
@@ -88,41 +60,6 @@ w
 x
 y
 z
-{
-|
-}
-~
-¿
 À
 Á
 Â
@@ -187,63 +124,126 @@ z
 ý
 þ
 ÿ
 Ą
 ą
 Ć
 ć
 Č
 č
 Ď
 ď
 Đ
 đ
 Ė
 ė
 Ę
 ę
 Ě
 ě
 Ğ
 ğ
 Į
 į
 İ
 ı
 Ĺ
 ĺ
 Ľ
 ľ
+Ŀ
 Ł
 ł
 Ń
 ń
 Ň
 ň
 ō
 Ő
 ő
 Œ
 œ
 Ŕ
 ŕ
 Ř
 ř
 Ś
 ś
 Ş
 ş
 Š
 š
 Ť
 ť
 Ū
 ū
 Ů
 ů
 Ű
 ű
 Ų
 ų
 Ÿ
 Ź
 ź
@@ -251,43 +251,295 @@ z
 ż
 Ž
 ž
+ſ
 ƒ
-ο
-०
-Ṡ
-ẞ
-Ạ
+ƿ
+ǿ
+ȿ
+!
+"
+#
+$
+%
+&
+'
+(
+)
+*
++
+,
+-
+.
+/
+:
+;
+<
+=
+>
+?
+@
+[
+\
+]
+_
+`
+{
+|
+}
+^
+~
+℉
+№
+Ω
+℮
+™
+∆
+✓
+✔
+✗
+✘
+✕
+☑
+☒
+●
+▪
+▫
+◼
+▶
+◀
+⬆
+¿
-–
@@ -302,15 +554,11 @@ z
-•
-‥
-′
-″
@@ -322,25 +570,17 @@ z
-⁄
-₂
-₃
-₡
+−
-€
-₴
+₡
+₴
-℉
-ℏ
-№
-™
-Ω
-℧
-Å
-℮
-⅀
+€
@@ -365,58 +605,84 @@ z
-←
+➀
+➁
+➂
+➃
+➄
+➅
+➆
+➇
+➈
+➉
+➊
+➋
+➌
+➍
+➎
+➏
+➐
+➑
+➒
+➓
+❶
+❷
+❸
+❹
+❺
+❻
+❼
+❽
+❾
+❿
+①
+②
+③
+④
+⑤
+⑥
+⑦
+⑧
+⑨
+⑩
-↔
-⇐
+←
+↔
+⇐
-∂
-∅
-∆
-∋
-∏
-∑
-−
-∓
-∕
-∖
-∗
-∙
-√
-∛
-∜
+∴
+∵
-∟
-∠
-∡
-∢
-∥
-∧
-∨
+∂
+∑
+∏
+√
+∛
+∜
-∴
-∵
+∖
+∗
@@ -427,76 +693,144 @@ z
-⋅
+□
+∥
+∋
+′
+″
+ÿ
+ο
+Å
+ℏ
-⍵
-①
-②
-③
-④
-⑤
-⑥
-⑦
-⑧
-⑨
-⑩
-─
-│
-└
-├
-■
-□
-▪
-▫
-▶
-◀
-●
-◼
-☑
-☒
-✓
-✔
-✕
-✗
-✘
-❶
-❷
-❸
-❹
-❺
-❻
-❼
-❽
-❾
-❿
-➀
-➁
-➂
-➃
-➄
-➅
-➆
-➇
-➈
-➉
-➊
-➋
-➌
-➍
-➎
-➏
-➐
-➑
-➒
-➓
-⬆
-、
-fi
-fl
-︽
-︾
-﹥
-�
+⍵
 𝑢
 𝜓
+०
+‥
+︽
+﹥
+•
+∕
+∙
+⋅
+∓
+∟
+∠
+∡
+∢
+℧
+☺