郭震 AI公众号:郭震AI

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

发布日期: 2026-06-03

分类: AI消息

预计阅读: 4 分钟

阅读次数: 0

你好,我是郭震

你的电脑里应该攒了不少资料吧?

PDF、Word、Excel,还有各种会议纪要、项目文档、论文、合同什么的。刚存的时候觉得以后肯定有用,结果真要用的时候,发现根本找不到。

尤其是文件多了,电脑里存了上千上万个文件时,靠 Windows 自带的搜索或者靠脑子记,基本就废了。你想找某一个具体的合同条款,或者某篇论文里的实验数据,翻半天也对不上号。

跟大家分享我对以上两个挺扎心问题的解决方法,感兴趣的可以看看。

1 难搞的扫描PDF

咱们平时存的 PDF,很多其实是扫码件,或者是排版特别复杂的论文,里面又是多栏排版,又是各种公式、表格:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

以前这种文件丢给 AI,它读出来的格式基本都乱掉了。

如下放到NotebookLM知识库中,解析后公式排版出现问题:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

这里分享一个靠谱的方法,就是使用MinerU,它专门治这种“难啃”的文档。

它能把那些复杂的公式、嵌套的表格,还有乱七八糟的扫描件,尽量保持和原文语义一致。

如下接入到DeepLocals知识库,通过MinerU完成解析,这个公式解析质量好于NotebookLM:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

这样你在问它问题的时候,它不再是凭感觉瞎猜,而是真能看清你那张表、那个公式到底写了啥。

如下图所示,在知识库检索问答时,它能精准命中对应的文档片段,并准确输出答案:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

MinerU为啥能做到解析质量如此之高,参考下图,得益于强大的智能文档解析引擎:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

一句话总结,通过MinerU的PDF解析能力,知识问答有了高质量的输入,从而保证了RAG检索的高精度。

2 私有资料+外部联动

很多时候,光看自己电脑里的资料是不够的。比如你写个调研报告,或者查个技术方案,除了看自家的文档,还得查查外面的专业论文才放心。

注意到MinerU最近直接接入了 Sciverse 这个学术库,里面有 2500 万篇公开的文献:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

这几天我经常使用的DeepLocals,也接入了MinerU最新升级的这个功能:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

你在提问的时候,顺手点一下“学术文献搜索”,它就会一边翻你本地的文件,一边帮你去查专业的学术论文。

如下图所示,提问diffusion总结,使用DeepSeek-V4大模型:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

它会从左侧本地知识库中,检索到我的本地PDF论文:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

同时还会从2500万学术文献库中查找到对应文献:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

而且参考的文献有多篇,如下文献11:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

文献9:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

文献8:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

一句话总结:这种“本地私有资料 + 外部专业证据”一起出来的效果,不仅能省掉大量查资料的时间,而且能得到更好、更全面的总结答案。

3 DeepSeek-V4+知识库

如下图所示,DeepLocals学习了我电脑的海量PDF、Word等文档:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

学习完成后还能看到文字+图片,支持多模态学习:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

结合学习到你的文件以图文形式回答,是一个更懂你的AI,支持云端和本地双模式,如下图所示:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

自动结合学习到的电脑文件,支持图文回复:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

四大专业预设模式:通用模式、法律模式、医学模式和科研模式:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

另外,还支持多个知识库间联合回答问题:

DeepSeek-V4 接入 MinerU,再难搞的扫描 PDF,也能丝滑问答!

比较常用的知识库,还有腾讯IMA等,感兴趣的大家也可以去体验IMA

最后总结一下

本文实测了DeepSeek-V4结合MinerU,解决扫描PDF处理问题,以及本地和外部知识联动,提供更好问答。** **

** 具体来说,通过 MinerU 把乱码的文档理顺,再通过 Sciverse 把全球的学术证据拉进来,这种“本地资料理得顺、外部文献找得准”的体验,成为一个称手的 AI 工作台该有的样子。**

如果你也深陷文档堆,想让 AI 带着证据帮你干活,那这套组合方法值得试一试。

全文1329字,26图,如果你觉得这篇文章对你有帮助,也欢迎给我一个三连击:点赞、转发和在看;如果可以,再帮我点一个⭐️。谢谢你看到这里,我们下篇再见。

Continue

更多相关文章推荐

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...