amazon
/
excel_tool


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687
							import pandas as pd
from urllib.parse import quote
from pathlib import Path

def create_hyperlink(value, base_url):
    """为给定的值创建亚马逊搜索页面的超链接"""
    return f'=HYPERLINK("{base_url}{quote(value)}&__mk_zh_CN=%E4%BA%9A%E9%A9%AC%E9%80%8A%E7%BD%91%E7%AB%99", "{value}")'

def create_asin_link(asin):
    """为ASIN创建产品详情页链接"""
    return f'=HYPERLINK("https://www.amazon.co.jp/dp/{asin}", "{asin}")'

def process_row(row, indices, processor):
    """为指定索引的单元格应用处理器函数"""
    for index in indices:
        if index < len(row):  # 确保索引在范围内
            row[index] = processor(row[index])
    return row

def column_letter_to_index(col_letter):
    """将Excel列字母转换为0基索引"""
    return sum((ord(c) - ord('A') + 1) * (26 ** i) for i, c in enumerate(reversed(col_letter.upper()))) - 1

def read_and_process_need_search_url_csv(input_file, output_file, columns, use_letters, base_url='', start_row=0):
    """读取CSV文件并处理需要添加搜索链接的列，然后写入新文件"""
    # 确保输出目录存在
    output_dir = Path(output_file).parent
    output_dir.mkdir(parents=True, exist_ok=True)
    
    # 使用pandas读取CSV文件
    df = pd.read_csv(input_file, encoding='cp936', keep_default_na=False)
    
    # 获取要处理的列的索引
    if use_letters:  # 如果使用列字母
        indices = [column_letter_to_index(col) for col in columns]
    else:  # 如果使用列索引（假设从0开始）
        indices = [int(col) for col in columns]

    # 遍历每一行并处理
    for i in range(start_row, len(df)):
        row = df.iloc[i].tolist()
        processed_row = process_row(row, indices, lambda value: create_hyperlink(value, base_url))
        df.iloc[i] = processed_row

    # 将处理后的数据写入新的CSV文件
    df.to_csv(output_file, index=False, encoding='utf-8')

def read_and_process_asin_csv(input_file, output_file, columns, use_letters, start_row=0):
    """读取CSV文件并处理ASIN列，然后写入新文件"""
    # 确保输出目录存在
    output_dir = Path(output_file).parent
    output_dir.mkdir(parents=True, exist_ok=True)
    
    # 使用pandas读取CSV文件
    df = pd.read_csv(input_file, encoding='cp936', keep_default_na=False)
    
    # 获取要处理的列的索引
    if use_letters:  # 如果使用列字母
        indices = [column_letter_to_index(col) for col in columns]
    else:  # 如果使用列索引（假设从0开始）
        indices = [int(col) for col in columns]

    # 遍历每一行并处理
    for i in range(start_row, len(df)):
        row = df.iloc[i].tolist()
        processed_row = process_row(row, indices, create_asin_link)
        df.iloc[i] = processed_row

    # 将处理后的数据写入新的CSV文件
    df.to_csv(output_file, index=False, encoding='utf-8')

# 定义要处理的CSV文件路径、输出文件路径以及需要添加超链接的列索引或列字母和亚马逊搜索的基础URL
output_dir = Path('temp')
input_csv_path = Path('/home/mrh/code/excel_tool/temp/测试.csv')
need_search_url_output_csv_path = output_dir / '测试_need_search_url_processed.csv'
asin_output_csv_path = output_dir / '测试_asin_processed.csv'
need_search_url_columns = ['B', 'C', 'D', 'E']  # 列
asin_columns = ['I', 'M', 'Q']   # ASIN列
use_letters = True  # 是否使用列字母代替索引
amazon_search_base_url = 'https://www.amazon.co.jp/s?k='
start_row = 1  # 从第2行开始处理（索引从0开始）

# 执行CSV处理
read_and_process_need_search_url_csv(input_csv_path, need_search_url_output_csv_path, need_search_url_columns, use_letters, amazon_search_base_url, start_row)

# 使用处理后的文件作为输入来处理ASIN列
read_and_process_asin_csv(need_search_url_output_csv_path, asin_output_csv_path, asin_columns, use_letters, start_row=start_row)