Jupyter AI

31 DeepSeekMine轻量便携版Win和Mac发布

📅发表日期: 2025-04-19

🏷️分类: DeepSeek学习

👁️阅读次数: 0

最近很多后台留言询问DeepSeekMine开发进度,今天这篇文章统一给大家汇报下,想把DeepSeek接入到自己的文件系统的,可以看看这篇文章。

1 个人知识库基本介绍

DeepSeek-R1,有几个小尺寸的版本,可以直接部署在个人电脑上,这样带来一个很大的好处,可以直接使用它来管理咱们的文件系统,诸如:PDF,Word,Excel等:

DeepSeekMine个人知识库

这种部署方案,完全不用大家花钱,并且在自己电脑管理文件,数据不会被上传到别人服务器,属于最安全的一种方法。

有些朋友可能第一次接触使用大模型管理个人文件,可能看到「本地知识库」就觉得一定是运行在本地,其实未必是。比如常见也非常好用的ima,属于远程知识库,文件都必须上传到云端(别人服务器),言外之意,断网后是无法使用的:

DeepSeekMine个人知识库

还有纳米AI,也说是本地知识库,其实并不是,大家断网后也是无法使用的,中间过程涉及的嵌入向量计算在远端,所以文件也被抓取到远程端。

2 DeepSeekMine轻量极速版

DeepSeekMine是我们开发的大模型接入知识库软件,已经开发迭代了两个多月,它是完全运行在本地的,100%不会被抓取到远程端,第一次登录绑定后,后面可以一直使用、完全离线。

当迭代到V6.1后,发现很多人的电脑配置一般,比如只有8G内存,老式intel CPU,如果去跑大模型,再跑嵌入向量,就会很吃力。

因此我们决定开发一个轻量极速版,大概得框架如下:

使用Meilisearch,无嵌入向量计算,如果结合知识图谱,也能达到使用向量差不多的精度,这样就能解决很多配置一般电脑跑本地知识库软件,如下图所示:

DeepSeekMine个人知识库

知识图谱基于lightRAG框架改造,然后调整为专门适合本地知识库的场景。算法框图如下所示:

DeepSeekMine个人知识库

在原有 LightRAG 框架的基础上,我们进行了非向量化重构,打造了更适合离线、本地知识库应用的知识图谱检索引擎:纯关键词 + 图谱检索:完全不依赖向量计算,适合在无 GPU、低资源环境中部署。

实体-关系抽取与图谱构建:对本地文档进行结构化解析,提取实体间的关系网络,实现“概念级”检索。图谱驱动的相关性增强:结合 BM25 检索结果,通过图谱路径扩展与实体联动,补全语义上下文。

零依赖、轻部署:无需 Embedding 模型和外部服务,真正做到离线可用、低功耗运行。

3 轻量极速版四个特点

轻量极速版的目标:四快,安装快,打开快,加载知识快,查询生成快,精度够用,如下所示:

DeepSeekMine个人知识库

目前四快还有优化空间,我们还会继续努力提升四快。

下面是我们已经实现的,逐一展示下效果。

先给大家看下mac版软件优化后的体积为350M,之前是900多M,所以体积直接减小了61.1%:

DeepSeekMine个人知识库

并且安装软件的速度之前是120秒,**现在安装软件时间大概控制在30秒内,**提速了4倍:

DeepSeekMine个人知识库

文件知识上传速度:

DeepSeekMine个人知识库

RAG+生成速度:

DeepSeekMine个人知识库

关于Docker打包,团队成员正在加紧在Windows不同系统上测试,看起来很简单的一件事,当真正实践去做的时候就不太容易了,大家都是业余时间在做,把休息时间都花在了这上面,感谢你们的付出!

最后,和关注我的读者们说一句,RAG本地知识库我们既然已经开始做了,不会放弃,只会勇往直前,让RAG精度越来越好,真正帮大家提升办公和学习效率。

4 轻量极速版安装包及软件使用步骤

目前Docker版本我们还在开发制作中,今天先发布Mac安装包(非Docker版),双击直接安装:

DeepSeekMine个人知识库

进入软件界面首页,显示轻量极速版:

DeepSeekMine个人知识库

点击右上角配置按钮,把ollama本地部署的大模型如DeepSeek-R1:1.5b, 或者7b配置到下面,如下图所示,只需要更改模型名称就行,其他维持默认值:

DeepSeekMine个人知识库

点击新建按钮,可以创建某类知识文件,点击进入。上传文档后,就可以提问了,比如比较私人的数据,如下提问:刘琳手机号,能够准确检索到,如下图所示:

DeepSeekMine个人知识库

1 在轻量版,我们继续优化了RAG精度:

图片

2 在DeepSeekMine最新轻量版,引入一个提升多轮次会话精度的算法:多短语双向回退算法,如下所示:

图片

它会自动提取关键专有实体词,根据会话智能调整顺序。这样做带来的效果,多轮会话时,自动结合过去轮次的会话,实现输入更少的提示词,也能更好回答提问:

连续提问1:

图片

连续提问2:

图片

连续提问3:

图片

3 进一步解决语义漂移问题,用户当前会话可能和之前会话发生了很大的语义漂移,此次RAG升级使用知识图谱自动捕捉实体词和关系,解决语义漂移问题,实现后效果如下所示:

首先提问了郭震的一些信息,如下两轮次会话:

图片

然后第三轮提问:刘琳手机号,正确检测到发生了语义漂移,并且智能排除之前无关提问信息,聚焦到当前信息,能够准确回答:

图片

4 文件夹托管上传,功能代码进一步提升健壮性,目前一次可以支持上传100个文件,一次上传100个及以上文件暂未测试,大家感兴趣的可以留言区反馈:

图片

5 自动按照文件类型,排序分类知识库里的文件:

图片

6 打开个人知识库管理页面后,默认只显示两个面板,笔记总结面板默认隐藏显示:

图片

7 接下来我们会同时支持:极速轻量版和专业版,大家根据自己的电脑配置选择使用

最后总结一下

总结来说,我们正在开发的DeepSeekMine轻量极速版,具有如下优势:

1)无需向量计算,降低硬件要求,适用于一般电脑配置;

2)知识图谱提供语义连接,易于本地部署,完全离线运行在本地,数据安全泄露降到最低;

3)软件使用免费,不用大家花一分钱。

💬 评论

暂无评论

🐳DeepSeek本地部署 (滚动鼠标查看)