🖥️ Hardware & razzfazz.ai Box

▶️ AMD Strix Halo Ubuntu 24.04 LTS

Strix Halo Linux-Stack im Mai 2026 endgültig stabil — Sweet Spot bleibt **Ubuntu 24.04 LTS + Kernel 6.18.x + ROCm 7.2.x + linux-firmware ≥20260110**, also exakt das deployte Setup. Ubuntu 24.04.4 (12.02.2026) mit neuem HWE-Stack (Kernel 6.17 + Mesa 25.2.8). **ROCm 7.2.3** seit 04./05.05.2026 (Bugfix-Release, vLLM-Profiling, MIGraphX). Vulkan-RADV-Pfad dramatisch verbessert (+25% auf MoE durch Wave32 FA + Graphics-Queue-Patches in b8460) — Qwen3-Coder 30B bei **97 t/s** auf Vulkan RADV. Phoronix bestätigt mit Ubuntu-26.04-Review ~20% zusätzliche Vulkan-Performance vs 25.04. Ollama hinkt mit b7437 (Dez 2025) **~56% hinter Standalone-llama.cpp** her — direkter Hebel für die Box.

Strix Halo (Ryzen AI Max+ 395, gfx1151, RDNA 3.5) ist die Plattform der razzfazz.ai Box. ROCm und Linux-Treiber waren bis Ende 2025 instabil, seit Q1 2026 produktiv. Wichtigster Stellhebel ist nicht ROCm sondern Vulkan-RADV-Pfad in llama.cpp.

7 News · Letzte: 2026-05-23 📡 RSS

HP Z2 Mini G1a Workstation mit AMD Ryzen AI Max+ 395 (Strix Halo)

HP Z2 Mini G1a Frontansicht - Notebookcheck Review

Phoronix-Benchmark Linux 7.0 + Mesa 26.0 auf Strix Halo (April 2026)

AMD Ryzen AI Max+ 395 (Strix Halo) Prozessorpaket

▶ ROCm+Linux Support on Strix Halo: It's finally stable in 2026!

News-Verlauf

23.05.2026 ·github.com·erfasst 23.05.2026

llama-cpp-for-strix-halo Build b9294 — frisches Vulkan/ROCm-Binary auf Ubuntu 24.04 lauffähig

Lychee Technology hat am 23.05.2026 die Tageskompilation b9294 von llama.cpp für Strix Halo veröffentlicht. Das Release liefert vier Assets als x86_64-Linux-Binaries: zwei ROCm-Builds (gegen ROCm 7.2.3 stable und gegen ROCm 7.13-nightly aus TheRock-dist gfx1151, Snapshot 20260515) plus die zugehörigen Vulkan-Tarballs. Damit ist der ROCm-Nightly bereits zwei Builds weiter als die auf der razzfazz.ai Box deployte ROCm-7.2-Linie, der stable-Pfad bleibt bei 7.2.3 (Bugfix-Release vom 05.05.). Für Ubuntu 24.04 LTS heißt das: die Tarballs entpacken sauber gegen den 6.18-HWE-Kernel und das aktuelle linux-firmware-Paket — kein Distro-Wechsel nötig. Auf Vukos Box ist b9294 der direkte Nachfolger des bereits bekannten b9279; der Sprung um 15 Builds enthält die jüngsten Upstream-Vulkan-Fixes für MoE-Modelle. Empfehlung: parallel zur stable b9279 ziehen, A/B-Benchmark auf Qwen3-Coder 30B fahren, dann produktiv switchen.

hoch — direkter Drop-in für die razzfazz.ai Box, kein Stack-Wechsel

22.05.2026 ·GitHub·erfasst 22.05.2026

llama-cpp-for-strix-halo Build b9279 — neueste Vulkan/ROCm-Binaries

Lychee-Technology veröffentlicht b9279 — 141. Release in Reihe vorgebauter Strix-Halo-Binaries (206 Commits). Reproduzierbare Linux-Binaries explizit für gfx1151 mit nötigen TTM-Tunings: ttm.page_pool_size=25600000 und ttm.pages_limit=25600000 — Voraussetzung dass Vulkan/ROCm-Allocations über 100-GB-Grenze hinaus funktionieren. Ohne diese Werte scheitern große Allocations stillschweigend. Builds tracken llama.cpp-Master mit automatischen Rebuilds.

DIREKTER Drop-in für razzfazz.ai Box — wenn eigener Custom-Build (llama-box-vulkan-custom) hinterherhinkt, lohnt Vergleich gegen b9279. TTM-Settings gegen Box-Image abgleichen.

05.05.2026 ·ROCm Documentation·erfasst 22.05.2026

ROCm 7.2.3 — Bugfix-Release mit vLLM-Profiling-Fixes (deployed Stack auf 7.2)

AMD veröffentlicht ROCm 7.2.3 (04./05.05.). Schwerpunkte: vLLM-Profiling (deutlich reduzierte Idle-Gaps zwischen GPU-Kernels bei torch.profiler), MIGraphX-Gather-Operator-Fusion für embedding-lastige Workloads, ONNX-Runtime External-Stream-Support, ROCm XIO Preview-Doku. KEINE expliziten Strix-Halo-Änderungen, aber offizielle AMD RDNA3.5-Doku listet 7.2.x als stabilen gfx1151-Pfad. Achtung: leichte int8-Quantization-Regression. Deprecation: ROCTracer/ROCProfiler/rocprof/rocprofv2 EOL Q2 2026 → Migration auf rocprofv3 und AMD SMI.

Deployed Stack ist ROCm 7.2 — minor Bump auf 7.2.3 = niedriges Risiko, Profiling-Verbesserungen helfen direkt für vLLM-Debugging. Bei nächstem Stack-Pull mitnehmen. Tooling-Migration zeitnah einplanen.

15.04.2026 ·GitHub·erfasst 22.05.2026

Ollama liegt 56% hinter Standalone-llama.cpp auf Strix Halo Vulkan

GitHub-Issue #15601 (geöffnet 15.04., offen) dokumentiert Vulkan-Performance-Gap: Ollama v0.20.5 mit eingebackenem llama.cpp b7437 (Dez 2025) erreicht auf Ryzen AI Max+ 395 nur ~34 t/s, Standalone-llama.cpp b8765 hingegen 52-56 t/s — Lücke ~56%. Ursache: zwei zentrale Vulkan-Patches fehlen — Wave32 Flash Attention (Merge 24.02., PR #19625) und Graphics-Queue-Nutzung auf AMD (Merge 15.03., PR #20551). Workaround: llama-swap als Reverse-Proxy + Standalone-llama.cpp, opfert aber Ollama-Modellmanagement.

HOCH — Ollama-Proxy IST im Stack! Kritisches Performance-Leak. Entweder eigenes Ollama-Build mit aktualisiertem vendored llama.cpp oder Bypass via llama-swap → Standalone llama.cpp.

08.04.2026 ·Phoronix·erfasst 22.05.2026

Ubuntu 26.04 + Strix Halo: ~20% Vulkan-Performance-Plus gegenüber 25.04

Phoronix-Review Ubuntu 26.04 (April 2026, basierend auf Linux 7.0 Kernel + Mesa 26.0): Strix Halo (Radeon 8060S) gegen 25.04 ~20% schneller auf RADV Vulkan, durchgängig signifikante Gains bei OpenGL (RadeonSI). ROCm wird auf 26.04 noch NICHT offiziell unterstützt, aber RADV/Vulkan trägt Großteil der Workloads ohnehin besser. **Ubuntu 24.04.5 wird 26.04-HWE-Stack als finalen HWE-Backport bringen** → Performance-Gains landen ohne LTS-Wechsel im Box-Image.

STRATEGISCH wichtigste News: Ubuntu 24.04 LTS bleibt korrekte Basis (Support bis 2029), mit 24.04.5 kommt 26.04-Stack per HWE-Backport rein. Kein Distro-Wechsel nötig.

15.03.2026 ·strixhalo.wiki·erfasst 22.05.2026

Vulkan-Graphics-Queue-Patch in llama.cpp — Strix-Halo-MoE +25%

Zwischen b8298 und b8460 (Mitte März) brachten zwei zusammenwirkende Vulkan-Patches (Wave32 FA Refactor + Graphics-Queue-Nutzung auf AMD) +25% Prompt-Processing und +25% Token-Generation für MoE-Modelle auf Strix Halo RADV. Dense-Modelle profitieren kaum (<2%, Memory-Bandwidth-Ceiling). Mai 2026 Rerun auf b9010: **Qwen3-Coder 30B von 87 → 97 t/s**, Qwen3-30B-A3B (MoE) 86 t/s. Vulkan RADV hat bei kurzem/mittlerem Context ROCm endgültig überholt — ROCm/HIP mit rocWMMA bleibt nur bei >130k Tokens vorne (~51 t/s pp vs 17 t/s RADV bei 130k).

KLARE Backend-Strategie: Vulkan RADV als Default-Pfad für alle Standard-Modelle (≤32k Context). ROCm/HIP nur als zweiter A/B-Pfad für Long-Context (>100k). Bestätigt M022-Architektur (Vulkan-Custom + ROCm-Custom als A/B) — Vulkan ist Mainline.

12.02.2026 ·OMG! Ubuntu·erfasst 22.05.2026

Ubuntu 24.04.4 LTS — neuer HWE-Stack (Kernel 6.17 + Mesa 25.2.8)

Canonical veröffentlicht Ubuntu 24.04.4 LTS — viertes Point-Release. Neuer HWE: Linux Kernel 6.17 + Mesa 25.2.8, beide aus 25.10 zurückportiert, via apt install linux-generic-hwe-24.04. AMD-Inhalte: ISP-Firmware-Updates, Navi44-Loading, AMD-SEV-Verbesserungen, 'AMD Krackan Stability'. gfx1151 ab 6.17.0-19.19~24.04.2 HWE-Kernel als stabil. 24.04.5 wird finaler HWE-Backport mit 26.04-Stack (Kernel 7.0 + Mesa 26.0) — Termin typischerweise August 2026.

Box läuft auf 24.04 LTS + Kernel 6.18.x — über HWE-Stand von 24.04.4 hinaus. Achtung: wenn Box linux-generic-hwe-24.04 zieht, könnte apt upgrade Kernel von 6.18 auf 6.17 zurückziehen. Pinning prüfen oder bei 24.04.5 (Q3 2026) auf 26.04-HWE umstellen.

← zurück zum Dashboard