郭震 AI公众号:郭震AI
返回 AI 小工具合集

AI Calculator

GPU 本地部署兼容性计算器

根据显存、模型参数、量化方式、上下文和 CPU offload 粗略判断能不能跑。

适合:Ollama、vLLM、本地知识库、私有部署

这是粗略兼容性估算,但新版拆出了模型权重、运行开销、KV cache 和 CPU offload,判断更清楚。

估算总占用
9.2 GB
权重
8.1 GB
KV cache
0.4 GB
可用显存
21.6 GB

显存内可跑

14B 模型在 4-bit / Q4 下约需要 9.2 GB。

真实部署还要给长 prompt、并发和不同推理框架留余量。