part-time-job/zhang_crawl_bio

mrh 62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢		1 سال پیش
..
export_files	1835feda6a 导出数据，后续测试，临时保存	1 سال پیش
converter_base.py	cee5551228 优化 crawl4ai 的 PDF 下载和保存逻辑。新增数据库字段 content_type 修改 html_path 改为 save_path 支持保存为 pdf 或 html ，新增 markdown 字段	1 سال پیش
crawl_filter.py	62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢	1 سال پیش
docling_converter.py	62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢	1 سال پیش
models.py	2c6ca2f59b 完成 docling 转换 markdown 。修复懒加载导致 HtmlConvertResult 无法获取 SearchResultItem 字段的错误	1 سال پیش
pandoc.py	62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢	1 سال پیش