Преглед изворни кода

feat: Add translate_csv script for translating CSV file content

mrh (aider) пре 1 година
родитељ
комит
6ecae9631a
1 измењених фајлова са 33 додато и 0 уклоњено
  1. 33 0
      excel2sql/translate_csv.py

+ 33 - 0
excel2sql/translate_csv.py

@@ -0,0 +1,33 @@
+import pandas as pd
+from dotenv import load_dotenv
+from mylib.pdfzh_translator import OpenAITranslator
+
+def translate_csv(input_file):
+    # 加载环境变量
+    load_dotenv()
+
+    # 读取CSV文件
+    df = pd.read_csv(input_file)
+
+    # 在B列右边插入一列空列
+    df.insert(2, 'C', '')
+
+    # 获取B列从第三行开始的数据
+    data_to_translate = df.iloc[2:, 1].tolist()
+
+    # 初始化翻译器
+    translator = OpenAITranslator()
+
+    # 批量翻译
+    translated_texts = translator._batch_translate(data_to_translate)
+
+    # 将翻译结果写入C列,从第三行开始
+    df.iloc[2:, 2] = translated_texts
+
+    # 保存修改后的CSV文件
+    output_file = input_file.replace('.csv', '_translated.csv')
+    df.to_csv(output_file, index=False)
+
+if __name__ == '__main__':
+    input_file = '/home/mrh/code/excel_tool/temp/测试.csv.utf8.csv'
+    translate_csv(input_file)