模型量化共1篇
大模型量化入门:GPTQ、AWQ 和 Qwen3-1.7B 实操-AI运维探索者

大模型量化入门:GPTQ、AWQ 和 Qwen3-1.7B 实操

一、为什么量化很重要 量化的本质是把模型从更高精度的数据格式压缩到更低精度,例如: * FP16 -> INT8 * FP16 -> INT4 这样做带来的主要收益有: * 模型体积更小; * 显存占用更低; * ...
头像7个月前
0319