Popular repositories Loading
-
-
PaddleOCR_pdf_web
PaddleOCR_pdf_web Public在数字化办公场景中,将扫描件或纯图片 PDF 转换为“可搜索、可选择、可复制”的 PDF 是一项刚需。本文将分享一个基于 **PaddleOCR** 和 **FastAPI** 开发的高性能 PDF OCR 服务。该项目通过**多线程并行处理**、**99% 还原 PDF 页面**的渲染算法和二分字号匹配技术,实现了生产级的处理速度与视觉还原精度。
-
PaddleOCR_PDF
PaddleOCR_PDF Public将**不可搜索的扫描版 PDF**(图片型)通过 OCR 技术转换为**可全文检索、可复制文字**的 PDF 文件,同时保留原始排版,并支持: - 中文、英文、符号混合识别 - 竖排文字、旋转文字正确还原 - GPU 自动加速(若可用) - 多核 CPU 并行处理提升效率 - 输出 PDF 体积小、兼容性好
Python 3
-
Something went wrong, please refresh the page to try again.
If the problem persists, check the GitHub status page or contact support.
If the problem persists, check the GitHub status page or contact support.