News-Verlauf
23.05.2026
·github.com·erfasst 23.05.2026
Lychee Technology hat am 23.05.2026 die Tageskompilation b9294 von llama.cpp für Strix Halo veröffentlicht. Das Release liefert vier Assets als x86_64-Linux-Binaries: zwei ROCm-Builds (gegen ROCm 7.2.3 stable und gegen ROCm 7.13-nightly aus TheRock-dist gfx1151, Snapshot 20260515) plus die zugehörigen Vulkan-Tarballs. Damit ist der ROCm-Nightly bereits zwei Builds weiter als die auf der razzfazz.ai Box deployte ROCm-7.2-Linie, der stable-Pfad bleibt bei 7.2.3 (Bugfix-Release vom 05.05.). Für Ubuntu 24.04 LTS heißt das: die Tarballs entpacken sauber gegen den 6.18-HWE-Kernel und das aktuelle linux-firmware-Paket — kein Distro-Wechsel nötig. Auf Vukos Box ist b9294 der direkte Nachfolger des bereits bekannten b9279; der Sprung um 15 Builds enthält die jüngsten Upstream-Vulkan-Fixes für MoE-Modelle. Empfehlung: parallel zur stable b9279 ziehen, A/B-Benchmark auf Qwen3-Coder 30B fahren, dann produktiv switchen.
hoch — direkter Drop-in für die razzfazz.ai Box, kein Stack-Wechsel
22.05.2026
·GitHub·erfasst 22.05.2026
Lychee-Technology veröffentlicht b9279 — 141. Release in Reihe vorgebauter Strix-Halo-Binaries (206 Commits). Reproduzierbare Linux-Binaries explizit für gfx1151 mit nötigen TTM-Tunings: ttm.page_pool_size=25600000 und ttm.pages_limit=25600000 — Voraussetzung dass Vulkan/ROCm-Allocations über 100-GB-Grenze hinaus funktionieren. Ohne diese Werte scheitern große Allocations stillschweigend. Builds tracken llama.cpp-Master mit automatischen Rebuilds.
DIREKTER Drop-in für razzfazz.ai Box — wenn eigener Custom-Build (llama-box-vulkan-custom) hinterherhinkt, lohnt Vergleich gegen b9279. TTM-Settings gegen Box-Image abgleichen.
05.05.2026
·ROCm Documentation·erfasst 22.05.2026
AMD veröffentlicht ROCm 7.2.3 (04./05.05.). Schwerpunkte: vLLM-Profiling (deutlich reduzierte Idle-Gaps zwischen GPU-Kernels bei torch.profiler), MIGraphX-Gather-Operator-Fusion für embedding-lastige Workloads, ONNX-Runtime External-Stream-Support, ROCm XIO Preview-Doku. KEINE expliziten Strix-Halo-Änderungen, aber offizielle AMD RDNA3.5-Doku listet 7.2.x als stabilen gfx1151-Pfad. Achtung: leichte int8-Quantization-Regression. Deprecation: ROCTracer/ROCProfiler/rocprof/rocprofv2 EOL Q2 2026 → Migration auf rocprofv3 und AMD SMI.
Deployed Stack ist ROCm 7.2 — minor Bump auf 7.2.3 = niedriges Risiko, Profiling-Verbesserungen helfen direkt für vLLM-Debugging. Bei nächstem Stack-Pull mitnehmen. Tooling-Migration zeitnah einplanen.
15.04.2026
·GitHub·erfasst 22.05.2026
GitHub-Issue #15601 (geöffnet 15.04., offen) dokumentiert Vulkan-Performance-Gap: Ollama v0.20.5 mit eingebackenem llama.cpp b7437 (Dez 2025) erreicht auf Ryzen AI Max+ 395 nur ~34 t/s, Standalone-llama.cpp b8765 hingegen 52-56 t/s — Lücke ~56%. Ursache: zwei zentrale Vulkan-Patches fehlen — Wave32 Flash Attention (Merge 24.02., PR #19625) und Graphics-Queue-Nutzung auf AMD (Merge 15.03., PR #20551). Workaround: llama-swap als Reverse-Proxy + Standalone-llama.cpp, opfert aber Ollama-Modellmanagement.
HOCH — Ollama-Proxy IST im Stack! Kritisches Performance-Leak. Entweder eigenes Ollama-Build mit aktualisiertem vendored llama.cpp oder Bypass via llama-swap → Standalone llama.cpp.
08.04.2026
·Phoronix·erfasst 22.05.2026
Phoronix-Review Ubuntu 26.04 (April 2026, basierend auf Linux 7.0 Kernel + Mesa 26.0): Strix Halo (Radeon 8060S) gegen 25.04 ~20% schneller auf RADV Vulkan, durchgängig signifikante Gains bei OpenGL (RadeonSI). ROCm wird auf 26.04 noch NICHT offiziell unterstützt, aber RADV/Vulkan trägt Großteil der Workloads ohnehin besser. **Ubuntu 24.04.5 wird 26.04-HWE-Stack als finalen HWE-Backport bringen** → Performance-Gains landen ohne LTS-Wechsel im Box-Image.
STRATEGISCH wichtigste News: Ubuntu 24.04 LTS bleibt korrekte Basis (Support bis 2029), mit 24.04.5 kommt 26.04-Stack per HWE-Backport rein. Kein Distro-Wechsel nötig.
15.03.2026
·strixhalo.wiki·erfasst 22.05.2026
Zwischen b8298 und b8460 (Mitte März) brachten zwei zusammenwirkende Vulkan-Patches (Wave32 FA Refactor + Graphics-Queue-Nutzung auf AMD) +25% Prompt-Processing und +25% Token-Generation für MoE-Modelle auf Strix Halo RADV. Dense-Modelle profitieren kaum (<2%, Memory-Bandwidth-Ceiling). Mai 2026 Rerun auf b9010: **Qwen3-Coder 30B von 87 → 97 t/s**, Qwen3-30B-A3B (MoE) 86 t/s. Vulkan RADV hat bei kurzem/mittlerem Context ROCm endgültig überholt — ROCm/HIP mit rocWMMA bleibt nur bei >130k Tokens vorne (~51 t/s pp vs 17 t/s RADV bei 130k).
KLARE Backend-Strategie: Vulkan RADV als Default-Pfad für alle Standard-Modelle (≤32k Context). ROCm/HIP nur als zweiter A/B-Pfad für Long-Context (>100k). Bestätigt M022-Architektur (Vulkan-Custom + ROCm-Custom als A/B) — Vulkan ist Mainline.
12.02.2026
·OMG! Ubuntu·erfasst 22.05.2026
Canonical veröffentlicht Ubuntu 24.04.4 LTS — viertes Point-Release. Neuer HWE: Linux Kernel 6.17 + Mesa 25.2.8, beide aus 25.10 zurückportiert, via apt install linux-generic-hwe-24.04. AMD-Inhalte: ISP-Firmware-Updates, Navi44-Loading, AMD-SEV-Verbesserungen, 'AMD Krackan Stability'. gfx1151 ab 6.17.0-19.19~24.04.2 HWE-Kernel als stabil. 24.04.5 wird finaler HWE-Backport mit 26.04-Stack (Kernel 7.0 + Mesa 26.0) — Termin typischerweise August 2026.
Box läuft auf 24.04 LTS + Kernel 6.18.x — über HWE-Stand von 24.04.4 hinaus. Achtung: wenn Box linux-generic-hwe-24.04 zieht, könnte apt upgrade Kernel von 6.18 auf 6.17 zurückziehen. Pinning prüfen oder bei 24.04.5 (Q3 2026) auf 26.04-HWE umstellen.