Commit History

Автор SHA1 Съобщение Дата
  何文松 f77b550332 fix: 修复 PaddleOCR CLI 输出文件查找逻辑 преди 1 ден
  何文松 ea558b73a4 refactor: 恢复命令行调用方式并支持双模式切换 преди 1 ден
  何文松 d4d6a9c30c perf: 禁用文档方向分类以提升处理速度 преди 1 ден
  何文松 10700986a9 feat: 添加 PaddleOCR 垃圾识别检测机制 преди 1 ден
  何文松 c662419077 fix: 使用正确的 save_to_markdown 方法保存结果 преди 1 ден
  何文松 888f6e69a6 debug: 添加详细调试信息以诊断 markdown 文件保存问题 преди 1 ден
  何文松 54fbc7fa71 fix: 改进 paddleocr_wrapper.py 的 markdown 文件查找逻辑 преди 1 ден
  何文松 7c129674c0 fix: 修复设备选择逻辑,确保 GPU 环境下使用 gpu:0 преди 1 ден
  何文松 386d5b0359 feat: 添加 GPU 显存检测和 MinerU 服务自动控制 преди 1 ден
  何文松 8c60c709d6 refactor: 使用独立脚本调用 PaddleOCR,避免显存共享问题 преди 1 ден
  何文松 5c5a032fbd fix: 修改 call_paddleocr 函数使用 Python API преди 1 ден
  何文松 4c4a7c4acb refactor: 移除 PaddleOCR 命令行调用,只使用 Python API преди 1 ден
  何文松 deaa0bfefe feat: 添加 PaddleOCR Python API 支持(暂时禁用,显存不足) преди 1 ден
  何文松 de7b25c053 feat: 使用 PaddleOCR Python API 替代命令行方式,支持图表识别和纯文本识别 преди 1 ден
  何文松 0282fe550c Revert "fix: 未配置 VL 后端时使用传统 ocr 命令,避免加载 VL 模型导致 OOM" преди 1 ден
  何文松 415a260763 fix: 未配置 VL 后端时使用传统 ocr 命令,避免加载 VL 模型导致 OOM преди 1 ден
  何文松 77d654abda perf: 降低 GPU 内存利用率至 0.4 为 PaddleOCR VL 预留显存 преди 1 ден
  何文松 bf3482857f fix: 修正 NVIDIA backend 为 vlm-vllm-async-engine преди 1 ден
  何文松 57bd09db47 fix: 修正 NVIDIA 环境 backend 名称为 vlm-async-engine преди 1 ден
  何文松 600bdb85e2 fix: PaddleOCR命令自动检测venv路径 + 添加PDF OCR测试 преди 1 седмица
  何文松 ace7956efd fix: converter.py 使用 config.yaml 的 backend/server_url 等配置,不再硬编码默认值 преди 3 седмици
  何文松 dcc86d8002 feat: 添加 /pdf_to_markdown 测试脚本;config.yaml 配置 vlm-http-client backend преди 3 седмици
  何文松 95ee7ca577 refactor: 附件切割OCR只保留Tesseract,移除PaddleOCR fallback;test_api适配anyuan环境 преди 3 седмици
  何文松 17e3a4454b fix(电磁检测): 修复线高与检测时间重复、测量值1错位 преди 3 седмици
  何文松 3e01997cc1 feat(电磁检测): 工频电场磁场检测结果中线高为空时默认为1.5 преди 3 седмици
  何文松 f382f9f7a4 fix(电磁检测): 监测地点续行合并时不再插入空格 преди 3 седмици
  何文松 e3e30d91f3 fix(电磁): 监测地点续行合并仅当除第二列外其余列均为空时触发 преди 3 седмици
  何文松 bd336ace01 feat(电磁): 首列为空且第二列为地名时合并到上一条监测地点 преди 3 седмици
  何文松 c8d3f04f05 feat: 识别异常时用Paddle解析全文档(full_document+extract_all_pages_from_pdf) преди 3 седмици
  何文松 e69dff9ab7 feat: 检测MinerU识别异常(同字重复)时用Paddle doc_parser结果替换markdown再解析 преди 3 седмици