Historial de Commits

Autor SHA1 Mensaje Fecha
  icecraft b492c19c4c refactor: move some constants or enums defs to config folder hace 1 año
  myhloli 08f46125a0 refactor(model): rename and restructure model modules hace 1 año
  myhloli 5936684fd8 refactor(pdf_parse): adjust line count threshold for layoutreader hace 1 año
  myhloli 5468e56fba refactor(pdf_parse): adjust line count limit for layoutreader hace 1 año
  myhloli 7d5850e3ce feat(model): add xycut algorithm for block sorting hace 1 año
  myhloli 149132d608 feat(pdf_parse): improve span filtering and add new block types hace 1 año
  myhloli ad0d06b6a0 fix(pdf_parse): improve span removal logic for all content types hace 1 año
  myhloli 509128d505 fix(pdf_parse): improve span removal logic for all content types hace 1 año
  myhloli eeda90af31 fix(pdf_parse): improve span removal logic for all content types hace 1 año
  myhloli 6b9f816f9e fix(pdf_parse): optimize span processing by removing outside spans hace 1 año
  myhloli 4cf7e9a224 refactor(pdf_parse): adjust block splitting logic for wide blocks hace 1 año
  myhloli c34c9d21ef refactor(ocr): improve image and table block handling hace 1 año
  icecraft 283b597a6e feat: add [figure | table] match [caption | footnote] match algorithm v2 hace 1 año
  myhloli 7e301b849b refactor(pdf): adjust span filling threshold in block construction hace 1 año
  myhloli 6f63e70e94 feat(pdf_parse_union_core_v2): reintegrate para_split_v3 and add page range support hace 1 año
  myhloli ded2818ac2 feat(layoutreader): support local model directory and improve model loading hace 1 año
  myhloli a71db70314 feat: add arXiv paper link to header and adjust PDF parsing logic- Add arXiv paper link to the header template for easy access to the latest research paper. hace 1 año
  myhloli 564c4ce1e3 refactor(magic_pdf): improve line sorting and block indexing hace 1 año
  myhloli 4c9bf8abd5 refactor(memory management): remove unused clean_memory function hace 1 año
  myhloli 42a7d792c3 refactor(magic_pdf): import model helpers directly for clarity hace 1 año
  myhloli 5522d0a36c refactor(pdf_parse_union_core_v2): update import paths to use new package structure hace 1 año
  myhloli 2145a8b6d2 fix(pdf_parse): handle blocks without lines and enable bf16 on compatible devices hace 1 año
  myhloli 177ab08e9f refactor(pdf_parse): remove redundant sorting and optimize block indexing hace 1 año
  myhloli b9dfdea3cb refactor(pdf_parse_union_core_v2): implement model initialization within classRefactored model initialization to be handled by a singleton class to ensure that model hace 1 año
  myhloli b2790f6f45 refactor(drawing): simplify draw bbox functions and adjust debug config hace 1 año
  myhloli 34f8965007 refactor(draw_bbox): add line sorting visualization hace 1 año
  myhloli 1efebe421c refactor(pdf_parse_union): integrate LayoutLMv3 for block orderingReplace the heuristic-based block ordering algorithm with LayoutLMv3 model predictions toimprove the accuracy of block ordering on PDF pages. Additionally, refactor the span hace 1 año