30 DeepSeekMine轻量便携版即将发布
最近收到大家很多关于个人知识库,DeepSeekMine的使用留言。
经过这几天我们的研究,将大家普遍关心和遇到的问题,在此给大家汇报下,感兴趣的可以看看。
1 软件无法启动问题
某些朋友遇到如下问题,DeepSeekMine软件无法启动。
过去两周重点研究了这个问题,私有化部署一般都会遇到此类问题,主要原因如下四类:
1)防火墙问题,未开启,安装DeepSeekMine无法启动
2)杀毒软件屏蔽
3)安装软件时选择了所有用户,导致软件依赖环境无法打开
4)与本地安装的Python环境冲突
尽管我们在发版前,已经充分内测,但是发版后总是还会遇到无法启动问题。
所以必须得拿出一个彻底解决的方法。
经过研究 ,发现Docker私有部署是一个最好的解决方案。
为什么Docker是最好的解决方案?原因主要有如下:
1)Docker 提供一个完全隔离的运行环境,不再依赖用户本地是否配置 Python 环境、不再受杀毒软件干扰,也避免与系统中已有的库或端口冲突。所有依赖都内置于镜像中,“一次构建,到处运行”。
2)相比传统手动安装,Docker 几乎是“傻瓜式”部署,非常适合普通人部署。
3)通过 Docker,大家只需拉取更新即可完成升级,后面就不用每次都手动下载软件安装包,可以说非常方便了。而且每次更新都是原子性的,不会影响已有数据,确保部署稳定可控。
4)支持三大主流操作系统:
所以基于以上四点原因,我们将会在接下来果断发布Docker部署的安装包,相信将会彻底解决大家遇到的DeepSeekMine软件无法启动的问题。
2 软件安装慢的问题
大家还反馈了软件安装过程有些长,大概2分钟时间,希望能更加迅速。
因为DeepSeekMine-V6开始内置了语义向量计算功能,所以安装时间一下加长了。
3 软件快速加载500G文件
有些朋友希望500G文件,能够快速读入到知识库里:
目前最好用的远程知识库ima,最多支持2G资料读取,所以500G的资料不可能喂入到ima里,所以希望增加500G以上文件读入。
4 RAG精度还是不够准
关于RAG精度问题,有些朋友跟我们反馈,DeepSeekMine-V6.1好像没有V6准确。
在这里我跟大家统一解释下,在某些情况确实出现了回退,主要原因为了解决Excel的精准查询,影响了部分普通文件的RAG精度。
5 即将发布轻量便携版
关于2、3、4问题,我们最近几天设计了一套完整的解决方案,准备在接下来几天发布DeepSeekMine轻量便携版,原来的专业版还会继续迭代,两个版本同时往前并行开发。
轻量便携版,主要实现四快:安装快、打开快、加载文件快、查询速度快,精度还够用。
要想实现轻量便携版的四快,主要技术框架图大概包括,Meilisearch高性能RAG引擎,分块chunking模块,提问关键词提取,关键词增强(多轮关键词融合,同义词嵌入等),命中片段BM25排序模块,技术框架图如下所示:
四快技术框架不会嵌入语义向量,主要考虑到本地个人电脑计算资源有限,引入嵌入向量,加大计算难度,带来的增益还不明显,所以轻量便携版排除向量嵌入。
那么如何弥补语义向量缺失带来的精度损失呢?
经过调研,发现lightRAG(北邮等开发的一个RAG框架),使用知识图谱的技术,抽取出不同层次的实体和关系,融合后框架如下所示:
为什么能弥补语义向量带来的精度损失?lightRAG 本身就不是基于语义向量,而是通过知识图谱来实现“结构化语义增强”,与Meilisearch + Chunking + BM25 等框架天然兼容。
融合lightRAG后的技术框架,因为不再有嵌入语义向量的计算,所以它非常适合轻量、本地部署、无GPU环境,是非常贴合离线场景的,具体在开发时,我们会想办法找到高效融合的方案。
我们会尽快保质保量的完成开发,尽快分享给大家使用,希望能真正帮助大家提升办公和学习效率。
总结一下
这篇文章主要说到了三个核心点:
1)启动难题,将由 Docker 私有部署方案彻底解决
DeepSeekMine 原先存在的无法启动问题,将通过发布 Docker 安装包得到根本解决,实现“一次构建,到处运行”,更稳定、更通用、更易维护。
2)四快轻量便携版即将发布,主打快速与实用
我们正在开发“轻量便携版”,聚焦安装快、启动快、加载快、查询快四大能力,特别适合资源有限的本地设备场景。
3)引入 lightRAG 知识图谱增强模块,有效弥补向量缺失的语义能力
新版本将不依赖向量嵌入,而是融合 lightRAG 框架,通过结构化实体关系补全语义,兼顾“轻量化部署”和“足够的RAG准确率”。