郭震 AI公众号:郭震AI

DeepSeek-V4 本地部署教程:LM Studio 跑 Qwen3.5-9B GGUF 实测

发布日期:

最近更新:

分类: AI消息

预计阅读: 4 分钟

阅读次数: 0

预计阅读4 分钟
结构重点5 个
图文要点0 张
正文规模1.9k 字

你好,我是郭震

这篇回答一个很明确的问题:DeepSeek-V4 的蒸馏版能不能在普通电脑本地跑?

我用 LM Studio 实测了 Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF,从下载、加载、对比测试到接入知识库都跑了一遍。

如果你正在搜索“DeepSeek-V4 本地部署”“LM Studio GGUF 模型怎么用”“普通电脑能不能跑 DeepSeek 推理模型”,这篇可以直接当一份实测笔记看。

先说结论:Q4_K_M 版本体积约 5.63GB,门槛比满血大模型低很多,更适合个人电脑体验 DeepSeek-V4 的推理风格,用在本地知识库、RAG、Agent 自动化工作流测试里。

相关阅读:本地模型部署可以继续看 本地大模型部署专题,模型选择和榜单可以看 大模型榜单与模型选型

1 本地部署DeepSeek-V4

使用社区,DeepSeek-V4的蒸馏版,发布三天下载就好几万了,足见大家对V4的喜爱:

Qwen3.5-9B DeepSeek-V4 GGUF 社区模型下载热度

安装DeepSeek-V4蒸馏本地部署版,先下载 LM Studio:

LM Studio 下载和安装入口

在搜索模型中,找到此模型,如下所示:

Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

LM Studio 搜索 Jackrong Qwen3.5 DeepSeek-V4 GGUF 模型

找到后,点击下载,如下图所示已下载12%:

LM Studio 下载 Q4_K_M GGUF 模型进度

这个模型是基于 Qwen3.5-9B 做的 DeepSeek-V4 蒸馏版。简单理解,就是用 DeepSeek-V4-Flash 的高质量推理数据,去增强一个 9B 小模型,让它尽量学到结构化推理、多步分析和工具调用能力。

它的优势是体积小、部署门槛低。比如 GGUF 的 Q4_K_M 版本大约 5.63GB,普通本地电脑也有机会跑起来。

这个模型主要面向结构化推理、快速本地推理和工具增强工作流。

我的定位是:适合个人电脑低成本体验 DeepSeek-V4 推理风格,用来做本地知识库、Agent 和自动化工作流测试。

2 测评蒸馏V4

下载完成后,加载使用:

LM Studio 加载 DeepSeek-V4 蒸馏 9B 模型

LM Studio 中使用它回答问题:

LM Studio 中测试 DeepSeek-V4 蒸馏模型回答问题

问一个简单编程题:

DeepSeek-V4 蒸馏模型回答简单编程题

问原来的9B模型,看看它的思考过程:

Ollama 中原始 Qwen3.5-9B 模型的思考过程

我是在Ollama里直接提问Qwen3.5-9B模型,因为已经安装,不想再在LM Studio安装一遍。

如果测试蒸馏后的9B模型是否更像DeepSeek-V4,我把以上两个模型的思考过程发给Gemini-3.1-Pro,让它评论谁更像DeepSeek-V4:

Gemini 对比蒸馏模型和原始模型的推理风格

看到Gemini给出结论,蒸馏后的9B更像DeepSeek:

Gemini 判断蒸馏 9B 模型更接近 DeepSeek 推理风格

总结如下:

Gemini 总结 DeepSeek 风格推理链差异

第一个生成的内容仅仅是一个“写作大纲”(Outline),它直接给出了结论并规划了文章结构;

第二个生成的内容才是一个真正的“推理链”,它展示了从“接收问题 -> 评估意图 -> 检索知识 -> 考虑边界条件 -> 权衡优缺点 -> 确定最终回答策略”的完整认知过程,这与 DeepSeek 推理模型(如 DeepSeek-R1)展现出的长思考、慢决策的特点完美契合。

结论:蒸馏9B实打实模仿到了DeepSeek-V4,石锤!

3 接入知识库

LM Studio 做知识库,限制就是最多上传5个文件,低于30M:

LM Studio 知识库上传文件数量和大小限制

咱们先初步测试下RAG效果:

LM Studio 上传文件后进行 RAG 问答测试

生成答案如下所示:

LM Studio 生成基于本地文件的 RAG 回答

同样问题,我们提问DeepSeekMine,这个知识库我们团队研发,支持上传上万文件。

如下所示我的电脑1万4千文件全部扔进去了:

DeepSeekMine 学习电脑中一万四千个本地文件

上传同样这五个文件:

DeepSeekMine 上传同一组知识库测试文件

可以看到文件总数,我们无限上传,最大支持到200M单文件。如下所示正在上传:

DeepSeekMine 展示文件上传进度和大小支持

如下图所示上传完成:

DeepSeekMine 本地资料文件上传完成

DeepSeekMine除了支持远程如GPT,Gemini等外,还支持本地配置本地大模型:

DeepSeekMine 配置本地大模型算力

配置本地大模型,使用本地算力,0成本养一个知识库。

如下提问它,对于总结类问题直接加载5个文件,回答总结会更好,如下图所示:

DeepSeekMine 使用本地模型总结上传文档

看到原来Qwen3.5-9B的思维链:

原始 Qwen3.5-9B 在文档总结任务中的思维链

思考16秒给出的总结:

DeepSeek-V4 蒸馏 9B 模型生成文档总结结果

看到蒸馏后的9B大模型,总结文档也要好于原来的9B:

Gemini 评价蒸馏 9B 模型更适合 RAG 总结

结论:做RAG,蒸馏的9B模型也更适合、更强大。Gemini给出的结论就是蒸馏9B已经够到第一梯队。

总结一下

DeepSeek-V4蒸馏版在本地电脑部署后,本文实测了其回答效果。

不管回答问题,还是做知识库,蒸馏DeepSeek-V4的9B好于原来的9B,感兴趣的可以按照文中步骤去体验。

全文1157字,28图,如果你觉得这篇文章对你有帮助,也欢迎给我一个三连击:点赞、转发和在看;如果可以,再帮我点一个⭐️。谢谢你看到这里,我们下篇再见。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

Related Signals

AI 新闻专题

延伸教程

AI 教程总索引

相关内容

更多相关文章

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...