Histórico de commits

Autor SHA1 Mensagem Data
  何文松 ace7956efd fix: converter.py 使用 config.yaml 的 backend/server_url 等配置,不再硬编码默认值 1 semana atrás
  何文松 dcc86d8002 feat: 添加 /pdf_to_markdown 测试脚本;config.yaml 配置 vlm-http-client backend 1 semana atrás
  何文松 95ee7ca577 refactor: 附件切割OCR只保留Tesseract,移除PaddleOCR fallback;test_api适配anyuan环境 1 semana atrás
  何文松 17e3a4454b fix(电磁检测): 修复线高与检测时间重复、测量值1错位 2 semanas atrás
  何文松 3e01997cc1 feat(电磁检测): 工频电场磁场检测结果中线高为空时默认为1.5 2 semanas atrás
  何文松 f382f9f7a4 fix(电磁检测): 监测地点续行合并时不再插入空格 2 semanas atrás
  何文松 e3e30d91f3 fix(电磁): 监测地点续行合并仅当除第二列外其余列均为空时触发 2 semanas atrás
  何文松 bd336ace01 feat(电磁): 首列为空且第二列为地名时合并到上一条监测地点 2 semanas atrás
  何文松 c8d3f04f05 feat: 识别异常时用Paddle解析全文档(full_document+extract_all_pages_from_pdf) 2 semanas atrás
  何文松 e69dff9ab7 feat: 检测MinerU识别异常(同字重复)时用Paddle doc_parser结果替换markdown再解析 2 semanas atrás
  何文松 81e98c0a90 fix: 备用解析时内容为图片但扩展名为.pdf则复制为正确扩展名再调doc_parser,避免PDFium Data format error 2 semanas atrás
  何文松 2dd570737c chore: 移除 PaddleOCR 子进程 LD_PRELOAD/static TLS 逻辑 2 semanas atrás
  何文松 974d87f967 chore: 日志中区分图表识别与文本识别([PaddleOCR 图表识别] / [PaddleOCR 文本识别]) 2 semanas atrás
  何文松 f6c245facc refactor: 将 call_paddleocr_ocr 改为使用不识别图表的 doc_parser 替代 ocr 子命令 2 semanas atrás
  何文松 fc1eee41c5 feat: 添加独立的推理服务和业务 API 启动脚本 2 semanas atrás
  何文松 ab1eda8d5d fix: 恢复 PDF 切割逻辑并修复 SyntaxError (非法字符) 2 semanas atrás
  何文松 96efa2f607 fix: 适配 MinerU API 调用逻辑并移除投资估算类型的自动切割预处理 2 semanas atrás
  何文松 82388ed8a5 fix: 调整 MinerU API 默认参数以优化表格识别效果 2 semanas atrás
  何文松 ed94d6102e fix: 修复 PaddleOCR ocr 命令不支持 VL 参数的问题 2 semanas atrás
  何文松 b354395778 feat: 在调用 MinerU API 前添加格式化的中英文对照参数日志 2 semanas atrás
  何文松 160834c486 feat: 适配全项目 PaddleOCR 命令行以支持 VL 识别后端配置 2 semanas atrás
  何文松 1cd66b8826 feat: 为 PaddleOCR doc_parser 添加 VL 识别后端配置支持 2 semanas atrás
  何文松 692a0a4103 refactor: 优化配置文件并恢复部分底层环境变量读取逻辑 2 semanas atrás
  何文松 080d9e4463 feat: 实现基于 YAML/JSON 的统一配置文件系统 2 semanas atrás
  何文松 1351543cd0 添加项目 README 文档 2 semanas atrás
  何文松 3e478f6b42 清理项目:删除多余的测试文件和重复文档 2 semanas atrás
  何文松 0fe830c65a fix(paddleocr): 子进程注入 LD_PRELOAD 与 PADDLE_PDX 避免 static TLS 与模型源检查 2 semanas atrás
  何文松 554cf82e2b pdf_converter_v2: GPU/NPU 采集适配、Paddle/MinerU 多卡单任务用满 2 semanas atrás
  何文松 14d0f42f6d pdf_converter_v2: 移除停止 mineru-api.service 的逻辑及开关 3 semanas atrás
  何文松 3f0d1df186 pdf_converter_v2: 添加 MINERU_RELEASE_BEFORE_PADDLE_OCR 开关,可选不释放 MinerU 3 semanas atrás