mrh 62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢 1 سال پیش
..
export_files 1835feda6a 导出数据,后续测试,临时保存 1 سال پیش
converter_base.py cee5551228 优化 crawl4ai 的 PDF 下载和保存逻辑。新增数据库字段 content_type 修改 html_path 改为 save_path 支持保存为 pdf 或 html ,新增 markdown 字段 1 سال پیش
crawl_filter.py 62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢 1 سال پیش
docling_converter.py 62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢 1 سال پیش
models.py 2c6ca2f59b 完成 docling 转换 markdown 。修复懒加载导致 HtmlConvertResult 无法获取 SearchResultItem 字段的错误 1 سال پیش
pandoc.py 62c5238036 html convert 去掉 filter_md 转换成 docx 因为资源加载很慢 1 سال پیش