➡ GPUStack
GPUStack ist Open-Source GPU-Cluster-Manager der vLLM und SGLang (und llama-box) für heterogene GPUs orchestriert. Deployed Version **v2.1.2 (21.04.2026)** ist auch die aktuell offiziell als 'Latest' markierte Stable-Release auf GitHub — keine neueren Releases. **v2.2.0** ist als Milestone seit 23.03.2026 in Entwicklung, ohne Release-Datum. Hauptfokus v2.2.0: massive Model-Catalog-Erweiterung (40+ neue Modelle), neuer T-Head PPU Hardware-Support, Integrationen mit Public Model Providers (OpenAI, Anthropic, DeepSeek, Doubao). Für deployed v2.1.2 aktuell keine CVEs.
GPUStack ersetzte im razzfazz.ai Stack die alte v0.7.1 Linie (jetzt frozen als Rollback). 2.x-Serie ist Architektur-Neufassung mit besserer Multi-Backend-Unterstützung (vLLM + llama.cpp/llama-box + SGLang) und ROCm 7.x — kritisch für Strix-Halo-basierte razzfazz.ai Box.
Aktuell keine News zu diesem Thema.