myhloli
|
41545a13c6
refactor(para): adjust line height multiplier for block splitting
|
hace 11 meses |
myhloli
|
f674b8d413
refactor(para): improve language detection and block splitting
|
hace 11 meses |
myhloli
|
160624bd36
refactor(para): improve block merging logic in para_split_v3.py
|
hace 11 meses |
myhloli
|
5d6cbcb123
refactor(para): improve line stop flag and remove unused debug mode
|
hace 1 año |
icecraft
|
b492c19c4c
refactor: move some constants or enums defs to config folder
|
hace 1 año |
myhloli
|
69805f4ba9
refactor(para): adjust right margin threshold based on block width
|
hace 1 año |
myhloli
|
517fbe5bf4
refactor(para): improve paragraph splitting logic
|
hace 1 año |
hyastar
|
220a24cd4c
更新 para_split_v3.py
|
hace 1 año |
myhloli
|
cf0d76c094
feat(para_split_v3): improve list identification with block aspect ratio
|
hace 1 año |
myhloli
|
2bf6c26871
feat(list): improve list detection algorithm- Add center_close_num and external_sides_not_close_num variables to analyze line positioning
|
hace 1 año |
myhloli
|
a8f2e7d6c4
fix(list): improve list identification accuracy- Adjust the threshold for determining right-side spacing to 0.26 * block_weight
|
hace 1 año |
myhloli
|
8cc76c4921
refactor(para): improve paragraph splitting algorithm
|
hace 1 año |
myhloli
|
81b9fd7bdb
refactor(para_split_v3): refine list block detection in paragraph splitting
|
hace 1 año |
myhloli
|
244b868443
fix(split_v3): Fix the rule adaptation for some special list samples.
|
hace 1 año |
myhloli
|
fdcb49d327
refactor(para_split_v3): merge list and index block detection
|
hace 1 año |
myhloli
|
1f1dd3538d
feat(list&index block): detect and merge list and index blocks
|
hace 1 año |
myhloli
|
7b42d5a0c4
fix: Solving the Grouping Anomaly Issue with Multiple Consecutive Non-Text Blocks
|
hace 1 año |
myhloli
|
6f63e70e94
feat(pdf_parse_union_core_v2): reintegrate para_split_v3 and add page range support
|
hace 1 año |