用於高效 CPU/GPU 推論的 GGUF 格式與 llama.cpp 量化。當在消費級硬體或 Apple Silicon 上部署模型,或在不需要 GPU 的情況下需要 2–8 位彈性量化時使用。
本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。