MinerU是由OpenDataLab团队打造的大模型时代的文档提取/转换神器
支持PDF、Word、PPT等多种文档的智能解析,可用于机器学习、大模型语料生产、RAG等场景…
xingwangzhe/xingwangzhe: My personal repository
你可以查看我的主页仓库来看具体效果:)
它应该被视作一种基本功,这也是为什么我看别的教程,往往在git命令上困惑的原因:(
项目地址:https://github.com/wuzheng228/hexo-pro