|
|
@@ -42,10 +42,16 @@ pdf2zh example.pdf -p 1 2 3
|
|
|
|
|
|
### 使用正则表达式指定需要保留样式的公式字体和字符
|
|
|
|
|
|
+注:从 `\ufb00` 开始是英文风格连字
|
|
|
+
|
|
|
```bash
|
|
|
-pdf2zh BDA3.pdf -f ".*\+(CM[^R].*|MS.*|XY.*|.*0700|.*0500)" -c "(\(|\||\)|\+|=|\d|[\u0080-\uffff])"
|
|
|
+pdf2zh BDA3.pdf -f ".*\+(CM[^RT].*|MS.*|XY.*|.*0700|.*0500)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
|
|
|
```
|
|
|
|
|
|
+## TODO
|
|
|
+
|
|
|
+- 基于 DiT 的独立公式及图表排版优化
|
|
|
+
|
|
|
## 致谢
|
|
|
|
|
|
文档合并:[PyMuPDF](https://github.com/pymupdf/PyMuPDF)
|