Browse Source

fix vflag

Byaidu 1 year ago
parent
commit
124ce13893
1 changed files with 2 additions and 2 deletions
  1. 2 2
      pdf2zh/converter.py

+ 2 - 2
pdf2zh/converter.py

@@ -417,7 +417,7 @@ class TextConverter(PDFConverter[AnyIO]):
                     if re.match(self.vchar,char):
                         return True
                 else:
-                    if re.match(r'(\+|=)',char) or (char and unicodedata.category(char[0]) in ['Lm','Sk','Mn']): # 公式加号和等号对应 CMR 而且不会出现在正文,公式减号对应 CMSY 不用考虑
+                    if char and unicodedata.category(char[0]) in ['Lm','Mn','Sk','Sm']:
                         return True
                 return False
             ptr=0
@@ -547,7 +547,7 @@ class TextConverter(PDFConverter[AnyIO]):
                             adv=vlen[vid]
                         except:
                             continue # 翻译器可能会自动补个越界的公式标记
-                        if len(var[vid])==1 and unicodedata.category(var[vid][0].get_text()[0]) in ['Lm','Sk','Mn']: # 文字修饰符,get_text 可能返回 cid,这里截断一下
+                        if len(var[vid])==1 and unicodedata.category(var[vid][0].get_text()[0]) in ['Lm','Mn','Sk']: # 文字修饰符,get_text 可能返回 cid,这里截断一下
                             mod=True
                     else: # 加载文字
                         ch=new[ptr]