English | 简体中文
PDF 文档翻译及双语对照
📊 保留公式和图表
📄 保留可索引目录
🌐 支持多种翻译服务
要求 Python 版本 >=3.8, <=3.11
pip install -U "pdf2zh>=1.5.3"
命令行中执行翻译指令,在工作目录下生成翻译文档 example-zh.pdf 和双语对照文档 example-dual.pdf。
pdf2zh example.pdf
pdf2zh example.pdf -p 1-3,5
pdf2zh example.pdf -li en -lo ja
参考 Ollama
pdf2zh example.pdf -s gemma2
参考 DeepLX
设置环境变量构建 endpoint:{DEEPLX_URL}/{DEEPLX_TOKEN}/translate:
DEEPLX_URL, e.g., export DEEPLX_URL=https://api.deeplx.orgDEEPLX_TOKEN, e.g., export DEEPLX_TOKEN=ABCDEFG执行:
pdf2zh example.pdf -s deeplx
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
Document merging: PyMuPDF
Document parsing: Pdfminer.six
Document extraction: MinerU
Multi-threaded translation: MathTranslate
Layout parsing: DocLayout-YOLO