icecraft
|
03469909bb
Feat/support footnote in figure (#532)
|
1 年間 前 |
yyy
|
d714ac8b76
Release: Release 0.7.1 verison, update dev (#527)
|
1 年間 前 |
drunkpig
|
18e65be489
fix: delete hyphen at end of line
|
1 年間 前 |
drunkpig
|
83e0d55a34
fix: replace \u0002, \u0003 in common text (#521)
|
1 年間 前 |
Xiaomeng Zhao
|
dd19f59eb6
fix(ocr_mkcontent): revise table caption output (#397)
|
1 年間 前 |
Xiaomeng Zhao
|
66e3ce9c4a
fix(ocr_mkcontent): improve language detection and content formatting (#458)
|
1 年間 前 |
liukaiwen
|
ec7271faee
fix table recognition bug#321
|
1 年間 前 |
myhloli
|
0998d22a32
fix(ocr_mkcontent): add spaces around inline equation in content
|
1 年間 前 |
Kaiwen Liu
|
37925f36d9
feat(model inference): add table recognition and conversion to LaTeX (#284)
|
1 年間 前 |
myhloli
|
a5c35165ee
feat(dict2md): add page index to para content for standard format v2
|
1 年間 前 |
myhloli
|
ff13c8e115
fix(mkmarkdown): add 2 space after image and table URLs
|
1 年間 前 |
赵小蒙
|
5de013e6d5
fix:use line_lang instead of content_lang to concatenate para
|
1 年間 前 |
赵小蒙
|
6199e608d4
add union_make logic
|
1 年間 前 |
liukaiwen
|
503b9fad3e
解决标题后空格丢失
|
1 年間 前 |
赵小蒙
|
f01cb89f01
fix lost image or table bug
|
1 年間 前 |
赵小蒙
|
e980d2efa0
fix UNIPipe and spans space with language
|
1 年間 前 |
赵小蒙
|
d3542f6a71
add para_to_standard_format logic
|
1 年間 前 |
赵小蒙
|
7631907f49
fix interline_equations block
|
1 年間 前 |
赵小蒙
|
81f73a3d9d
避免空para导致的error
|
1 年間 前 |
赵小蒙
|
52777b224a
fix ocr_mk_markdown_with_para_core_v2
|
1 年間 前 |
赵小蒙
|
d7128a9d87
更新mm markdown拼装函数
|
1 年間 前 |
赵小蒙
|
2728e5d16b
ocr mk markdown fix
|
1 年間 前 |
赵小蒙
|
18b02ae3bd
Pipe类重构
|
1 年間 前 |
赵小蒙
|
1f186f5f45
fix pdf_info_dict dict->list
|
1 年間 前 |
赵小蒙
|
709a65008a
中间态dict结构调整
|
1 年間 前 |
赵小蒙
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 年間 前 |
赵小蒙
|
00f16239c6
实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path
|
1 年間 前 |
赵小蒙
|
ca7059e514
注释更新
|
1 年間 前 |
赵小蒙
|
97153fabb8
(统一格式)修复中文语境下长文本因分词导致文本丢失问题
|
1 年間 前 |
赵小蒙
|
05fe0548b1
修复中文语境下长文本因分词导致文本丢失和content间被增加额外空格的问题
|
1 年間 前 |