| .. |
|
export_files
|
1835feda6a
导出数据,后续测试,临时保存
|
1 an în urmă |
|
converter_base.py
|
cee5551228
优化 crawl4ai 的 PDF 下载和保存逻辑。新增数据库字段 content_type 修改 html_path 改为 save_path 支持保存为 pdf 或 html ,新增 markdown 字段
|
1 an în urmă |
|
crawl_filter.py
|
62c5238036
html convert 去掉 filter_md 转换成 docx 因为资源加载很慢
|
1 an în urmă |
|
docling_converter.py
|
62c5238036
html convert 去掉 filter_md 转换成 docx 因为资源加载很慢
|
1 an în urmă |
|
models.py
|
2c6ca2f59b
完成 docling 转换 markdown 。修复懒加载导致 HtmlConvertResult 无法获取 SearchResultItem 字段的错误
|
1 an în urmă |
|
pandoc.py
|
62c5238036
html convert 去掉 filter_md 转换成 docx 因为资源加载很慢
|
1 an în urmă |