|
|
@@ -189,7 +189,7 @@ class TranslateConverter(PDFConverterEx):
|
|
|
return True
|
|
|
else:
|
|
|
if re.match( # latex 字体
|
|
|
- r"(CM[^R]|(MS|XY|MT|BL|RM|EU|LA|RS)[A-Z]|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)",
|
|
|
+ r"(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)",
|
|
|
font,
|
|
|
):
|
|
|
return True
|
|
|
@@ -278,7 +278,7 @@ class TranslateConverter(PDFConverterEx):
|
|
|
pstk.append(Paragraph(child.y0, child.x0, child.x0, child.x0, child.size, False))
|
|
|
if not cur_v: # 文字入栈
|
|
|
if ( # 根据当前字符修正段落属性
|
|
|
- child.size > pstk[-1].size / 0.79 # 1. 当前字符显著比段落字体大
|
|
|
+ child.size > pstk[-1].size # 1. 当前字符比段落字体大
|
|
|
or len(sstk[-1].strip()) == 1 # 2. 当前字符为段落第二个文字(考虑首字母放大的情况)
|
|
|
) and child.get_text() != " ": # 3. 当前字符不是空格
|
|
|
pstk[-1].y -= child.size - pstk[-1].size # 修正段落初始纵坐标,假设两个不同大小字符的上边界对齐
|