🖥️ Hardware & razzfazz.ai Box

🔺 AMD Strix Halo Plattform

AMD hat am 21./22. Mai 2026 die naechste Generation der Strix Halo-Plattform vorgestellt: Die Ryzen AI Max 400 Series ('Gorgon Halo') unterstuetzt nun bis zu 192 GB LPDDR5X-8533 Unified Memory (zuvor 128 GB), wovon bis zu 160 GB als VRAM allokiert werden koennen, womit lokal 300B+ Parameter LLMs lauffaehig sind. Top-SKU ist der Ryzen AI Max+ PRO 495 mit 16 Zen-5-Kernen, Boost bis 5,2 GHz, 40 RDNA-3.5-CUs (Radeon 8065S, 3,0 GHz) und 55 TOPS XDNA-2-NPU. Parallel kuendigte AMD die finale Ryzen AI Halo Developer Box (Mini-PC, 150x150x43 mm) mit Ryzen AI Max+ 395, 128 GB Unified Memory, 2 TB PCIe-4.0-SSD und Wi-Fi 7 fuer 3.999 USD an Vorbestellungen starten im Juni 2026. OEM-Systeme mit Ryzen AI Max PRO 400 (ASUS, HP, Lenovo) folgen ab Q3/2026. HP Z2 Mini G1a bleibt als erste Workstation-Loesung mit Strix Halo (Ryzen AI Max+ PRO 395, bis 128 GB RAM, ab 4.586 USD) prominent positioniert.

Strix Halo ist AMDs APU-Plattform mit Zen 5 CPU (bis 16 Cores), Radeon 8060S iGPU (40 RDNA 3.5 CUs, ~60 TFLOPS) und 256-bit LPDDR5X Memory-Controller — kein PCIe-GPU-Slot, dafür Unified Memory bis 128 GB (bald 192 GB). Exakte Hardware-Basis der razzfazz.ai Box.

11 News · Letzte: 2026-05-22 📡 RSS

AMD Ryzen AI Halo Mini-PC — Pre-Order Juni 2026 ab $3.999

Beelink GTR9 Pro — Strix Halo Mini-PC im Mac-Studio-Look, $1.999

Beelink GTR9 Pro Unterseite mit Belüftungsdesign

AMD Ryzen AI Max+ Strix Halo Die Shot - annotierte Triple-Die-Architektur

SIXUNITED AXB88 - 1,2-Liter Strix-Halo-Mini-Workstation (Massenproduktion Maerz 2026)

AMD Ryzen AI Max+ 395 - Flagship-SKU der Strix-Halo-Familie

AMD CES-2026-Keynote - Vorstellung der erweiterten Strix-Halo-Familie

AMD Ryzen AI Max+ Chip-Render (offizielles AMD-Pressefoto)

News-Verlauf

22.05.2026 ·Notebookcheck·erfasst 23.05.2026

Ryzen AI Max PRO 400 Series offiziell: Drei SKUs (Max+ PRO 495 / PRO 490 / PRO 485) mit Zen 5, RDNA 3.5 und bis zu 192 GB LPDDR5X

AMD hat in einem eigenen Blog-Post die finale Produkt-Lineup der Ryzen AI Max PRO 400 Series ('Gorgon Halo') konkretisiert und damit das davor nur grob skizzierte Refresh-Portfolio mit Namen, Taktraten und Speichersupport untermauert. An der Spitze steht der Ryzen AI Max+ PRO 495 mit 16 Zen-5-Kernen / 32 Threads, 5,2 GHz Boost, 80 MB Cache und voller 40-CU Radeon 8060S iGPU; darunter folgen der PRO 490 (12C, niedrigere Taktraten, ebenfalls 40-CU iGPU) und der PRO 485 (8C, beschnittene iGPU). Alle drei behalten den 256-bit LPDDR5X-Memory-Controller, unterstützen nun aber LPDDR5X-8533 und bis zu 192 GB Unified Memory, von denen bis zu 160 GB als VRAM allokiert werden können. AMD positioniert die Plattform explizit als 'Agent Computer'-Basis: Lokale Agenten-Stacks (LLM + Tool-Calls + Vector-DB) sollen vollständig auf der iGPU laufen, ohne Cloud-Roundtrips. Notebookcheck weist darauf hin, dass AMD diesmal ausschließlich PRO-Varianten ankündigt — Consumer-SKUs der 400er-Serie sind vorerst nicht im Plan. OEM-Systeme von ASUS, HP und Lenovo folgen ab Q3/2026; bis dahin bleibt der Ryzen AI Max+ 395 (Strix Halo) das aktuell kaufbare Topmodell.

hoch — direkter Nachfolger der razzfazz.ai-Box-Hardware; konkretes Upgrade-Target (192 GB) für Vukos lokalen LLM-Stack ab Q3/2026

22.05.2026 ·TechPowerUp·erfasst 23.05.2026

TechPowerUp: Detail-Specs zum Ryzen AI Max 400 Launch — LPDDR5X-8533 statt 8000, 256 GB/s Bandbreite bleibt, NPU auf 55 TOPS

TechPowerUp hat die technische Spec-Tabelle zur AMD-Ankündigung vom 21./22. Mai aufbereitet und einige Detail-Punkte herausgearbeitet, die im AMD-Blog selbst nur am Rande erwähnt werden. Wichtigster Punkt: Der Memory-Controller wurde nicht auf 384-bit verbreitert, sondern bleibt bei 256-bit — das 50%-mehr-Kapazitäts-Plus (192 GB vs. 128 GB) kommt allein über höher gestapelte LPDDR5X-Module zustande. Die Speichergeschwindigkeit steigt von LPDDR5X-8000 auf LPDDR5X-8533, was die effektive Bandbreite von ca. 256 GB/s auf rund 273 GB/s erhöht — ein moderater, aber für Token-Generation-Throughput durchaus relevanter Schritt. Die XDNA-2-NPU wird mit 55 TOPS angegeben (vorher 50 TOPS bei Strix Halo) — laut TechPowerUp aber primär durch aggressivere Power-Budgets, nicht durch neue Silicon-Blöcke. AMD selbst beschreibt Gorgon Halo offen als 'Refresh', nicht als neue Generation; der Die ist mutmaßlich identisch zu Strix Halo, nur mit neuem Memory-IP-Binning. Für Vukos Box bedeutet das: Ein 1:1-Aufrüstpfad ist unwahrscheinlich (Sockel/Board sind BGA), aber die nächste Hardware-Iteration zeichnet sich klar ab.

hoch — Bandbreite und NPU-TOPS sind die zwei wichtigsten Performance-Kennzahlen für lokale LLM-Inferenz auf der razzfazz.ai-Box

22.05.2026 ·Sleeping Robots·erfasst 23.05.2026

llama.cpp PR #22673: Multi-Token Prediction (MTP) bringt Qwen3.6-27B auf Strix Halo von 11,7 auf 21,2 tok/s (Q4), bis 4,8× bei Q8

Am 16. Mai gemerged, in den Tagen danach von der Community auf Strix Halo durchgemessen: llama.cpp's neuer MTP-Speculative-Decoding-Pfad (--spec-type draft-mtp) liefert auf Ryzen AI Max+ 395 die mit Abstand größten Geschwindigkeitssprünge seit dem ROCm-7.0-Release. Caleb Coffies Benchmarks zeigen für Qwen3.6-27B Q4_K_M ein 1,81×-Speedup (11,7 → 21,2 tok/s) bei MTP n=3; mit Q8_0 liegt der Faktor sogar bei 2,44× (7,4 → 18,1 tok/s). Sleeping Robots berichtet in einem unabhängigen Test sogar von 4,8× (6,2 → 29,8 tok/s) für dasselbe Modell. Der entscheidende Vorteil gegenüber klassischem Speculative Decoding: MTP nutzt im Modell eingebaute Draft-Heads, teilt sich Embeddings, LM-Head, Tokenizer und KV-Cache — kein separates Draft-Modell, praktisch kein extra VRAM-Verbrauch. Voraussetzung ist ein Modell mit MTP-Head; aktuell unterstützt sind Qwen3.6-27B (dense) und Qwen3.6-35B-A3B (MoE). Für Strix Halo, dessen schwacher Punkt traditionell die Memory-Bandbreite ist, ist MTP der effektivste Hebel der letzten Monate — und kommt ohne Hardware-Wechsel.

hoch — direkter, kostenloser Performance-Hebel für Vukos bestehende Box; Qwen3.6 ist Standard-Workload

22.05.2026 ·AMD Blog·erfasst 23.05.2026

AMD-Blog stellt Ryzen AI Halo + Max PRO 400 als 'Agent Computer'-Plattform vor — Ziel: Lokale 200B-Parameter-Agenten

AMD hat parallel zum SKU-Launch einen eigenen Blog-Post veröffentlicht, der die Ryzen AI Halo-Box und die Max PRO 400 Series explizit als 'Next-Generation Agent Computers' positioniert. Die zentrale Botschaft: Strix/Gorgon Halo ist nicht (mehr nur) eine Inference-Box, sondern soll als lokales Substrate für agentische KI-Workloads dienen — also Workflows aus LLM-Calls, Tool-Use, RAG und persistentem State, die mehrere Minuten bis Stunden auf einer Maschine laufen. AMD nennt konkret Modelle 'bis 200 Milliarden Parameter' für die 128-GB-Variante (Max+ 395) und 'über 300 Milliarden Parameter' für die kommenden 192-GB-PRO-400-Systeme. Die Software-Seite kommt mit ROCm 7.x, expliziter Windows-11- und Linux-Unterstützung sowie einem überarbeiteten 'AMD AI Stack' inklusive vorgefertigter Container für vLLM, llama.cpp und Ollama. Strategisch interessant: AMD geht direkt gegen Nvidias DGX Spark in Stellung, beansprucht 4–14 % höhere Token-Generation und betont die x86-Kompatibilität als Vorteil für Enterprise-Tooling. Die Box bleibt 150×150×43 mm, 120 W TDP, $3.999 ab Juni 2026 exklusiv bei Micro Center.

mittel — Positionierung 'Agent Computer' ist direkt razzfazz.ai-Use-Case; offizielle 200B/300B-Parameter-Zahlen sind belastbar

22.05.2026 ·ServeTheHome·erfasst 23.05.2026

ServeTheHome: Ryzen AI Halo Mini-PC im Detail — 120 W, programmierbarer RGB-Streifen, Ubuntu-Demo, Pre-Order Juni

ServeTheHome hat nach dem AMD-Briefing einen detaillierten Hands-on-Bericht zur Ryzen AI Halo Developer Box veröffentlicht. Neue, bisher nicht öffentlich kommunizierte Details: Die Demo-Einheit lief unter Ubuntu (nicht Windows), der vordere LED-Streifen ist über das neue amd_halo_led-Kernelmodul programmierbar und das Gehäuse nutzt ein Vapor-Chamber-Design für die 120-W-Konfiguration. Die 2-TB-PCIe-Gen4-SSD ist M.2-2280 und tauschbar; Wi-Fi 7 läuft über ein MediaTek-Modul. AMD bestätigte gegenüber STH, dass die finale Box ausschließlich über Micro Center (USA) und ausgewählte Distributoren in EU/Asien vertrieben wird — ein direkter AMD-Webshop-Verkauf ist nicht geplant. Pre-Order-Start ist 'irgendwann im Juni', ein konkretes Datum nannte AMD nicht. Eine PRO-495-Variante mit 192 GB ist 'auf dem Weg', aber ohne Termin. STH ordnet die Box als direkten Mac-Studio- und DGX-Spark-Konkurrenten ein und sieht den $3.999-Preis als aggressiv gegenüber Nvidia ($4.000+ für vergleichbare Spark-Konfigs), aber teuer gegenüber Custom-Builds (Framework Desktop mit 128 GB liegt bei ~$2.500).

mittel — konkrete Hardware-Details (RGB-Kernel-Modul, Ubuntu, Vapor Chamber) relevant für Vukos eigene Box-Beurteilung

21.05.2026 ·The Register·erfasst 22.05.2026

AMD enthüllt eigene Ryzen AI Halo Workstation — $3.999 ab Juni, will sich in 6 Monaten amortisieren

AMD publiziert offizielle Details zur 'Ryzen AI Halo' Developer-Workstation. Juni 2026 exklusiv über Micro Center für $3.999. Ryzen AI Max+ 395 (16C/32T Zen 5, bis 5.1 GHz), 128 GB LPDDR5X-8000, Radeon 8060S iGPU (40 RDNA 3.5 CUs), 50 TOPS XDNA 2 NPU, 2 TB PCIe Gen4 NVMe. 5.9×5.9×1.7 inch (kleiner als Mac Mini Pro), Wi-Fi 7, BT 5.4, HDMI 2.1b, 10 GbE. TDP 45-120W, Standard 55W. OHNE OS — Win ODER Linux (direkter Konter gegen Linux-only DGX Spark). 6-Monats-Amortisation durch Cloud-Einsparungen. Modelle bis 200B Parameter lokal (GPT-OSS 120B, Qwen 3.5 122B).

HOCH — Direkt konkurrierendes Produkt zur razzfazz.ai Box (gleicher Chip, gleicher RAM, gleicher Formfaktor). Preis $3.999 und 6-Monats-Narrativ sind 1:1 die razzfazz.ai-Verkaufsargumente — AMD validiert Market Fit aber schafft Konkurrenzdruck. Differenzierung schärfen: vorinstallierter Stack, GDPR, EU-Lieferung, lokaler Support.

07.05.2026 ·KitGuru·erfasst 22.05.2026

Q3 2026: Ryzen AI Max PRO 400 Series bringt bis 192 GB Unified Memory und 160 GB VRAM

AMD bestätigt Hardware-Refresh in Q3 2026 mit Ryzen AI Max PRO 400 Series. Zentrale Neuerung: aktualisierte Memory-Controller die bis **192 GB LPDDR5X Unified Memory** unterstützen (statt 128 GB), wovon bis **160 GB als VRAM** reservierbar sind. Höhere Clocks (Flagship 5.2 GHz statt 5.1 GHz) und LPDDR5X-8533 statt -8000. Codename 'Gorgon Halo' — kein neues Silizium, Refresh auf gleicher Zen 5 + RDNA 3.5 Basis im 4nm. Systeme von ASUS, HP, Lenovo ab Q3 2026.

GAME CHANGER für razzfazz.ai Box V2. 192 GB + 160 GB VRAM macht 200B+ MoE-Modelle (DeepSeek V3, Qwen3-235B-A22B) lokal nativ lauffähig — ohne Quantisierung auf <4bit. Strategisch: Box V2 Roadmap auf Q3/Q4 2026 ausrichten. Marketing: '192 GB unified memory' wird das wichtigste Spec-Differenzierungsmerkmal.

22.01.2026 ·Phoronix·erfasst 22.05.2026

Linux/ROCm 7.0 produktionsreif auf Strix Halo — Phoronix bestätigt Stabilität

Phoronix testet ROCm 7.0 auf Ryzen AI Max+ 395 mit Radeon 8060S (Ubuntu 24.04.3 LTS, Linux 6.14, AMDGPU DKMS). ROCm 7.0 stabil, llama.cpp Vulkan vs ROCm verglichen, vLLM funktioniert. Erkenntnisse: (1) amd_iommu=off bringt 5-12% Performance. (2) Kernel <6.18.4 hat gfx1151-Stabilitätsbug — Upgrade Pflicht. (3) Für llama.cpp: Build mit -DGGML_HIP_ROCWMMA_FATTN=ON und ROCBLAS_USE_HIPBLASLT=1 empfohlen; rocWMMA-Pfad bekommt pending Rewrite kein Update und ist bei langem Context langsamer als regulärer ROCm/HIP.

DIREKT relevant für razzfazz.ai Box Production. Stack läuft auf Kernel 6.18.x + ROCm 7.2 + Ubuntu 24.04 LTS — alles in offiziell unterstütztem Bereich. amd_iommu=off Optimierung prüfen: 5-12% gratis Performance.

06.01.2026 ·ServeTheHome·erfasst 22.05.2026

CES 2026: AMD ergänzt Strix Halo um Max+ 392 (12C) und Max+ 388 (8C) — beide mit vollem 40-CU iGPU

Zwei neue SKUs erweitern Lineup nach unten. **Max+ 392**: 12C/24T Zen 5, bis 5.0 GHz, 76 MB Cache, 50 TOPS NPU, voller Radeon 8060S iGPU (40 CUs). **Max+ 388**: 8C/16T, bis 5.0 GHz, gleicher iGPU, gleicher NPU. Beide volle 256 GB/s Unified Memory Bandbreite und bis 128 GB. Verfügbarkeit Q1 2026. Erste Benchmarks: Max+ 392 in ASUS TUF Gaming A14 schneller als Ryzen 9 7900X Desktop bei MultiCore.

Eröffnet razzfazz.ai Box 'Lite'-Konfiguration: 8C + voller 40-CU iGPU + 128 GB RAM zu signifikant niedrigerem Chip-Preis. Für KI-Inferenz-only-Kunden ist CPU-Power irrelevant — 388 könnte beste Preis/Performance-Profil bekommen.

15.11.2025 ·strixhalo.wiki·erfasst 22.05.2026

strixhalo.wiki: Vulkan (RADV) schlägt ROCm bei Standard-Context, ROCm gewinnt bei Long-Context

Community-Wiki publiziert llama.cpp Benchmarks für Qwen3 30B-A3B-UD-Q4_K_XL. **Vulkan (pp512/tg128)**: AMDVLK 741.60/81.79 t/s, RADV 755.14/85.11 t/s. **ROCm**: Standard 650.59/64.17 t/s, mit hipBLASlt 651.93/63.95, Tuned 659.07/67.66. **Long-Context (128K depth)**: Bild dreht sich — Tuned ROCm 51.12/13.32 t/s, RADV 17.24/12.54, AMDVLK nur 10.75/3.51. Bottom: Vulkan (RADV) = Default für Standard, Tuned ROCm gewinnt bei langen Contexten. Power-Modes: 85W ist Sweet Spot.

VALIDIERT razzfazz.ai Stack-Architektur (M022). Vulkan als Default + ROCm-Alternative für Long-Context = genau die richtige Konfiguration. Datenpunkt für Kunden-Pitches und Tuning-Entscheidungen.

15.10.2025 ·strixhalo.wiki·erfasst 22.05.2026

Strix Halo Mini-PC-Markt explodiert: 10+ Hersteller von $1.499 bis $2.499

Ende 2025/Anfang 2026 über 10 Geräte ausgereift. **GMKtec EVO-X2** ($1.499 für 128 GB) Default-Empfehlung — günstigste vollausgestattete Box. **Beelink GTR9 Pro** ($1.999) — Mac-Studio-Optik, 4 Front-Mikros. **Framework Desktop** (~$2.499) — Mini-ITX 4.5L, enterprise, repairable, OSS-Firmware, im Stresstest nur 144W (vs EVO-X2 186W), Linux-best-in-class laut Phoronix. **HP Z2 Mini G1a** — Enterprise-Workstation. Sapphire zeigt sogar Dual-Unit-Cluster für 235B Modelle.

Marktkonsolidierung — razzfazz.ai Box konkurriert direkt mit GMKtec/Beelink/Framework. Differenzierung über vorinstallierten Stack, EU-Compliance, Service. Framework Desktop als Linux-Best-Box = direkte technische Benchmark. Watch: Sapphire Dual-Cluster — möglicher 'Cluster Box' Roadmap-Punkt.

← zurück zum Dashboard