hqq-quantization | 技能详情 | OpenClaw Study

面向大语言模型的半二次量化(Half-Quadratic Quantization),无需校准数据。当将模型量化到4/3/2位精度而不需要校准数据集、需要快速量化工作流,或在 vLLM 或 HuggingFace Transformers 上部署时使用。Quantization, HQQ, Optimizat…

面向大语言模型的半二次量化(Half-Quadratic Quantization),无需校准数据。当将模型量化到4/3/2位精度而不需要校准数据集、需要快速量化工作流,或在 vLLM 或 HuggingFace Transformers 上部署时使用。Quantization, HQQ, Optimizatio......

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português