|
|
1 рік тому | |
|---|---|---|
| pdf2zh | 1 рік тому | |
| .gitignore | 1 рік тому | |
| LICENSE | 1 рік тому | |
| README.md | 1 рік тому | |
| setup.py | 1 рік тому |
基于字体规则和深度学习的 Latex PDF 翻译及双语对照,保留公式和图表排版
pip install pdf2zh
命令行中执行翻译指令,在当前目录下生成中文文档 example-zh.pdf 以及双语文档 example-dual.pdf
pdf2zh example.pdf
pdf2zh example.pdf -p 1-3,5
注:从 \ufb00 开始是英文风格连字
pdf2zh BDA3.pdf -f ".*+(CM[^RT].*|MS.*|XY.*|MT.*|BL.*|.*0700|.*0500|.*Italic)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
文档合并:PyMuPDF
文档解析:pdfminer.six
多线程翻译:MathTranslate
排版解析:LayoutParser