AI Calculator

GPU 本地部署兼容性计算器

根据显存、模型参数、量化方式、上下文和 CPU offload 粗略判断能不能跑。

适合：Ollama、vLLM、本地知识库、私有部署

这是粗略兼容性估算，但新版拆出了模型权重、运行开销、KV cache 和 CPU offload，判断更清楚。

显存 GB系统内存 GB模型参数 B量化上下文 K tokensCPU offload 预算 GB

估算总占用

9.2 GB

权重

8.1 GB

KV cache

0.4 GB

可用显存

21.6 GB

显存内可跑

14B 模型在 4-bit / Q4 下约需要 9.2 GB。

真实部署还要给长 prompt、并发和不同推理框架留余量。