显存计算器

根据模型规模、量化等级和并发目标,快速估算本地显存可行性。

使用前检查

  • 输入模型规模和量化类型,先看是否可跑。
  • 结合并发与上下文长度估算安全余量。
  • 若超出预算,再决定降配还是云端回退。