Historial de Commits

Autor SHA1 Mensaje Fecha
  mrh 9712124875 基于上下文管理器完成谷歌搜索,用的测试指纹浏览器 hace 10 meses
  mrh 9138dec48e 测试指纹浏览器和示例 camoufox hace 10 meses
  mrh 3de3e57e9c 转移目录结构 hace 10 meses
  mrh 4875fb3dc9 pandoc 并未能转换。原因待查明 hace 10 meses
  mrh b356480683 single search key convert all format:md,html,docx, use pandoc, docling hace 10 meses
  mrh cf43f2a601 浏览器新增随机 ua hace 10 meses
  mrh 5b323bb205 完成批量搜索,倒是仍然遇到反爬检测 hace 10 meses
  mrh 0a0b65e876 完成 dp 最后一页的检查 hace 10 meses
  mrh d09e9d56ca 修改 excel 导入管理 hace 10 meses
  mrh (aider) 77bd06e99f refactor: Convert excel_import functions to class-based approach hace 10 meses
  mrh (aider) 333e4f2d83 feat: add progress tracking and management for Excel keywords hace 10 meses
  mrh d3642e09b5 改变数据模型架构 hace 10 meses
  mrh (aider) 64f0fb921d fix: use sqlalchemy.text() for raw SQL execution in drop_table hace 10 meses
  mrh 1c46f2b7ce refactor: Make `drop_table` function accept a model parameter hace 10 meses
  mrh (aider) e8250fe763 refactor: modify drop_table to only delete SearchResult table hace 10 meses
  mrh (aider) 5a07937f67 feat: add is_last_page field to track search pagination end hace 10 meses
  mrh becc835c83 refactor: Add debug print and database initialization in SearchManager hace 10 meses
  mrh dfca410425 新增日志库 hace 10 meses
  mrh (aider) 3143d25dab feat: add cache parameter to search methods for database lookup hace 10 meses
  mrh (aider) 51bee11ffb refactor: extract database save logic into separate method in SearchManager hace 10 meses
  mrh f5db96a546 refactor: remove unused methods and adjust return value in search_manager hace 10 meses
  mrh (aider) 4ce06ce2c8 refactor: move database logic to DatabaseManager and add duplicate checking hace 10 meses
  mrh 03506cf2d5 默认的 crawl4ai 有反爬检测,新增一个 Drission 管理看看如何规避 hace 10 meses
  mrh (aider) a33426c675 fix: Pass datetime.now as callable to default_factory in SearchResult hace 10 meses
  mrh 8ab84386e7 refactor: Rename `Keyword` to `SearchResult` and add `DatabaseManager` class hace 10 meses
  mrh ad8aa1e1f0 循环读取关键词并搜索。新问题:页面存在却提示无结果 hace 10 meses
  mrh c9d00c553e 将 excel 导入数据库 hace 10 meses
  mrh 78e12d7b83 加入 dristion page 后关键词搜索 hace 10 meses
  mrh c0573ee7ad crawlai 似乎不支持自定义浏览器,只能用内置的。方案1:用外置浏览器爬取网页后再给 crawlai 解析。方案2:看看能否设置 User-agent 、session、cookie hace 10 meses