This website works better with JavaScript
首页
发现
帮助
注册
登录
zhengchun
/
MinerU
关注
1
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
fbc8d21d6a
分支列表
标签列表
zhch158
MinerU
/
docs
/
zh
/
known_issues.md
known_issues.md
657 B
文件历史
原始文件
Known Issues
阅读顺序基于模型对可阅读内容在空间中的分布进行排序,在极端复杂的排版下可能会部分区域乱序
对竖排文字的支持较为有限
目录和列表通过规则进行识别,少部分不常见的列表形式可能无法识别
代码块在layout模型里还没有支持
漫画书、艺术图册、小学教材、习题尚不能很好解析
表格识别在复杂表格上可能会出现行/列识别错误
在小语种PDF上,OCR识别可能会出现字符不准确的情况(如拉丁文的重音符号、阿拉伯文易混淆字符等)
部分公式可能会无法在markdown中渲染