English | 简体中文
PDF 文档翻译及双语对照
📊 保留公式和图表
📄 保留可索引目录
🌐 支持多种翻译服务
要求 Python 版本 >=3.8, <=3.11
pip install -U "pdf2zh>=1.5.3"
命令行中执行翻译指令,在工作目录下生成翻译文档 example-zh.pdf 和双语对照文档 example-dual.pdf
pdf2zh example.pdf
pdf2zh example.pdf -p 1-3,5
参考 Google Languages Codes, DeepL Languages Codes
pdf2zh example.pdf -li en -lo ja
参考 Ollama
设置环境变量构建接入点:{OLLAMA_HOST}/api/chat
OLLAMA_HOST(可选), e.g., export OLLAMA_HOST=https://localhost:11434
pdf2zh example.pdf -s ollama:gemma2
参考 DeepLX
设置环境变量构建接入点:{DEEPL_SERVER_URL}/{DEEPL_AUTH_KEY}/translate
DEEPL_SERVER_URL(可选), e.g., export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY, e.g., export DEEPL_AUTH_KEY=xxx
pdf2zh example.pdf -s deepl
参考 OpenAI
设置环境变量构建接入点:{OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL(可选), e.g., export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY, e.g., export OPENAI_API_KEY=xxx
pdf2zh example.pdf -s openai:gpt-4o
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
文档合并:PyMuPDF
文档解析:Pdfminer.six
文档提取:MinerU
多线程翻译:MathTranslate
布局解析:DocLayout-YOLO
文档标准:PDF Explained, PDF Cheat Sheets