面向大语言模型的半二次量化(Half-Quadratic Quantization),无需校准数据。当将模型量化到4/3/2位精度而不需要校准数据集、需要快速量化工作流,或在 vLLM 或 HuggingFace Transformers 上部署时使用。Quantization, HQQ, Optimizat…
面向大语言模型的半二次量化(Half-Quadratic Quantization),无需校准数据。当将模型量化到4/3/2位精度而不需要校准数据集、需要快速量化工作流,或在 vLLM 或 HuggingFace Transformers 上部署时使用。Quantization, HQQ, Optimizatio......
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。