llama-cpp | 技能詳情 | OpenClaw Study

在 CPU、Apple Silicon 與不依賴 NVIDIA 硬體的消費級 GPU 上運行 LLM 推論。適用於邊緣部署、M1/M2/M3 的 Mac、AMD/Intel GPU，或在 CUDA 無法使用時使用。支援 GGUF 量化（1.5-8 位），可降低記憶體使用，並相較於 CPU 上的 PyTorch…

在 CPU、Apple Silicon 與不依賴 NVIDIA 硬體的消費級 GPU 上運行 LLM 推論。適用於邊緣部署、M1/M2/M3 的 Mac、AMD/Intel GPU，或在 CUDA 無法使用時使用。支援 GGUF 量化（1.5-8 位），可降低記憶體使用，並相較於 CPU 上的 PyTorch 提...

本頁屬於 OpenClaw Skills 學習體系，涵蓋技能安裝、分類導覽與實戰連結。