Няма описание

何文松 ace7956efd fix: converter.py 使用 config.yaml 的 backend/server_url 等配置,不再硬编码默认值 преди 1 седмица
mineru 206bdccbb4 pdf_converter_v2: 同步设备环境识别(nvi/npu)、mineru-api.service、config/utils;mineru: models_download_utils local配置None检查 преди 3 седмици
pdf_converter_v2 ace7956efd fix: converter.py 使用 config.yaml 的 backend/server_url 等配置,不再硬编码默认值 преди 1 седмица
service 4f5a7abbe2 pdf_converter_v2: 服务与根 converter 默认 API 改为 127.0.0.1:5282 преди 3 седмици
.gitignore ae554b049f 初始化提交 преди 4 седмици
README.md 1351543cd0 添加项目 README 文档 преди 2 седмици
start_api.sh fc1eee41c5 feat: 添加独立的推理服务和业务 API 启动脚本 преди 2 седмици
start_api_in_container.sh bbdcf16906 完善适配NPU преди 3 седмици
start_inference.sh fc1eee41c5 feat: 添加独立的推理服务和业务 API 启动脚本 преди 2 седмици
start_mineru_in_container.sh d6d3fedfcc 优化逻辑并适配NPU преди 3 седмици

README.md

PDF Converter V2 - NPU 加速文档解析系统

基于 MinerU 和 PaddleOCR 的 PDF 文档解析系统,支持华为昇腾 NPU 加速。

项目结构

.
├── pdf_converter_v2/     # 主项目代码
│   ├── api/             # FastAPI 接口
│   ├── parser/          # 文档解析器
│   ├── processor/       # 处理器
│   ├── utils/           # 工具函数
│   └── requirements.txt # Python 依赖
├── mineru/              # MinerU 库
└── service/             # systemd 服务配置

快速开始

1. 宿主机 CPU 模式(推荐)

# 激活虚拟环境
source /root/work/paddle/.venv_paddleocr/bin/activate

# 使用 CPU 运行
cd pdf_converter_v2
python main.py --input test/your_file.pdf --device cpu

2. Docker NPU 模式

# 启动 Docker 容器(推荐)
bash start_paddleocr_docker_fixed.sh

3. MinerU API 调用

# 启动 API 服务
cd pdf_converter_v2
python api_server.py

# 调用 API
curl -X POST "http://127.0.0.1:5282/file_parse" \
  -F "file=@test/your_file.pdf" \
  -F "parse_method=auto" \
  -F "is_json_md_dump=true"

系统要求

  • ARM64 + 华为昇腾 NPU (8x 910B4-1)
  • CANN 8.5.0.alpha002
  • Python 3.10+
  • Docker (用于 NPU 模式)

文档

详细文档请参见 pdf_converter_v2/README.md