News-Verlauf
22.05.2026
·Notebookcheck·erfasst 23.05.2026
AMD hat in einem eigenen Blog-Post die finale Produkt-Lineup der Ryzen AI Max PRO 400 Series ('Gorgon Halo') konkretisiert und damit das davor nur grob skizzierte Refresh-Portfolio mit Namen, Taktraten und Speichersupport untermauert. An der Spitze steht der Ryzen AI Max+ PRO 495 mit 16 Zen-5-Kernen / 32 Threads, 5,2 GHz Boost, 80 MB Cache und voller 40-CU Radeon 8060S iGPU; darunter folgen der PRO 490 (12C, niedrigere Taktraten, ebenfalls 40-CU iGPU) und der PRO 485 (8C, beschnittene iGPU). Alle drei behalten den 256-bit LPDDR5X-Memory-Controller, unterstützen nun aber LPDDR5X-8533 und bis zu 192 GB Unified Memory, von denen bis zu 160 GB als VRAM allokiert werden können. AMD positioniert die Plattform explizit als 'Agent Computer'-Basis: Lokale Agenten-Stacks (LLM + Tool-Calls + Vector-DB) sollen vollständig auf der iGPU laufen, ohne Cloud-Roundtrips. Notebookcheck weist darauf hin, dass AMD diesmal ausschließlich PRO-Varianten ankündigt — Consumer-SKUs der 400er-Serie sind vorerst nicht im Plan. OEM-Systeme von ASUS, HP und Lenovo folgen ab Q3/2026; bis dahin bleibt der Ryzen AI Max+ 395 (Strix Halo) das aktuell kaufbare Topmodell.
hoch — direkter Nachfolger der razzfazz.ai-Box-Hardware; konkretes Upgrade-Target (192 GB) für Vukos lokalen LLM-Stack ab Q3/2026
22.05.2026
·TechPowerUp·erfasst 23.05.2026
TechPowerUp hat die technische Spec-Tabelle zur AMD-Ankündigung vom 21./22. Mai aufbereitet und einige Detail-Punkte herausgearbeitet, die im AMD-Blog selbst nur am Rande erwähnt werden. Wichtigster Punkt: Der Memory-Controller wurde nicht auf 384-bit verbreitert, sondern bleibt bei 256-bit — das 50%-mehr-Kapazitäts-Plus (192 GB vs. 128 GB) kommt allein über höher gestapelte LPDDR5X-Module zustande. Die Speichergeschwindigkeit steigt von LPDDR5X-8000 auf LPDDR5X-8533, was die effektive Bandbreite von ca. 256 GB/s auf rund 273 GB/s erhöht — ein moderater, aber für Token-Generation-Throughput durchaus relevanter Schritt. Die XDNA-2-NPU wird mit 55 TOPS angegeben (vorher 50 TOPS bei Strix Halo) — laut TechPowerUp aber primär durch aggressivere Power-Budgets, nicht durch neue Silicon-Blöcke. AMD selbst beschreibt Gorgon Halo offen als 'Refresh', nicht als neue Generation; der Die ist mutmaßlich identisch zu Strix Halo, nur mit neuem Memory-IP-Binning. Für Vukos Box bedeutet das: Ein 1:1-Aufrüstpfad ist unwahrscheinlich (Sockel/Board sind BGA), aber die nächste Hardware-Iteration zeichnet sich klar ab.
hoch — Bandbreite und NPU-TOPS sind die zwei wichtigsten Performance-Kennzahlen für lokale LLM-Inferenz auf der razzfazz.ai-Box
22.05.2026
·Sleeping Robots·erfasst 23.05.2026
Am 16. Mai gemerged, in den Tagen danach von der Community auf Strix Halo durchgemessen: llama.cpp's neuer MTP-Speculative-Decoding-Pfad (--spec-type draft-mtp) liefert auf Ryzen AI Max+ 395 die mit Abstand größten Geschwindigkeitssprünge seit dem ROCm-7.0-Release. Caleb Coffies Benchmarks zeigen für Qwen3.6-27B Q4_K_M ein 1,81×-Speedup (11,7 → 21,2 tok/s) bei MTP n=3; mit Q8_0 liegt der Faktor sogar bei 2,44× (7,4 → 18,1 tok/s). Sleeping Robots berichtet in einem unabhängigen Test sogar von 4,8× (6,2 → 29,8 tok/s) für dasselbe Modell. Der entscheidende Vorteil gegenüber klassischem Speculative Decoding: MTP nutzt im Modell eingebaute Draft-Heads, teilt sich Embeddings, LM-Head, Tokenizer und KV-Cache — kein separates Draft-Modell, praktisch kein extra VRAM-Verbrauch. Voraussetzung ist ein Modell mit MTP-Head; aktuell unterstützt sind Qwen3.6-27B (dense) und Qwen3.6-35B-A3B (MoE). Für Strix Halo, dessen schwacher Punkt traditionell die Memory-Bandbreite ist, ist MTP der effektivste Hebel der letzten Monate — und kommt ohne Hardware-Wechsel.
hoch — direkter, kostenloser Performance-Hebel für Vukos bestehende Box; Qwen3.6 ist Standard-Workload
22.05.2026
·AMD Blog·erfasst 23.05.2026
AMD hat parallel zum SKU-Launch einen eigenen Blog-Post veröffentlicht, der die Ryzen AI Halo-Box und die Max PRO 400 Series explizit als 'Next-Generation Agent Computers' positioniert. Die zentrale Botschaft: Strix/Gorgon Halo ist nicht (mehr nur) eine Inference-Box, sondern soll als lokales Substrate für agentische KI-Workloads dienen — also Workflows aus LLM-Calls, Tool-Use, RAG und persistentem State, die mehrere Minuten bis Stunden auf einer Maschine laufen. AMD nennt konkret Modelle 'bis 200 Milliarden Parameter' für die 128-GB-Variante (Max+ 395) und 'über 300 Milliarden Parameter' für die kommenden 192-GB-PRO-400-Systeme. Die Software-Seite kommt mit ROCm 7.x, expliziter Windows-11- und Linux-Unterstützung sowie einem überarbeiteten 'AMD AI Stack' inklusive vorgefertigter Container für vLLM, llama.cpp und Ollama. Strategisch interessant: AMD geht direkt gegen Nvidias DGX Spark in Stellung, beansprucht 4–14 % höhere Token-Generation und betont die x86-Kompatibilität als Vorteil für Enterprise-Tooling. Die Box bleibt 150×150×43 mm, 120 W TDP, $3.999 ab Juni 2026 exklusiv bei Micro Center.
mittel — Positionierung 'Agent Computer' ist direkt razzfazz.ai-Use-Case; offizielle 200B/300B-Parameter-Zahlen sind belastbar
22.05.2026
·ServeTheHome·erfasst 23.05.2026
ServeTheHome hat nach dem AMD-Briefing einen detaillierten Hands-on-Bericht zur Ryzen AI Halo Developer Box veröffentlicht. Neue, bisher nicht öffentlich kommunizierte Details: Die Demo-Einheit lief unter Ubuntu (nicht Windows), der vordere LED-Streifen ist über das neue amd_halo_led-Kernelmodul programmierbar und das Gehäuse nutzt ein Vapor-Chamber-Design für die 120-W-Konfiguration. Die 2-TB-PCIe-Gen4-SSD ist M.2-2280 und tauschbar; Wi-Fi 7 läuft über ein MediaTek-Modul. AMD bestätigte gegenüber STH, dass die finale Box ausschließlich über Micro Center (USA) und ausgewählte Distributoren in EU/Asien vertrieben wird — ein direkter AMD-Webshop-Verkauf ist nicht geplant. Pre-Order-Start ist 'irgendwann im Juni', ein konkretes Datum nannte AMD nicht. Eine PRO-495-Variante mit 192 GB ist 'auf dem Weg', aber ohne Termin. STH ordnet die Box als direkten Mac-Studio- und DGX-Spark-Konkurrenten ein und sieht den $3.999-Preis als aggressiv gegenüber Nvidia ($4.000+ für vergleichbare Spark-Konfigs), aber teuer gegenüber Custom-Builds (Framework Desktop mit 128 GB liegt bei ~$2.500).
mittel — konkrete Hardware-Details (RGB-Kernel-Modul, Ubuntu, Vapor Chamber) relevant für Vukos eigene Box-Beurteilung
21.05.2026
·The Register·erfasst 22.05.2026
AMD publiziert offizielle Details zur 'Ryzen AI Halo' Developer-Workstation. Juni 2026 exklusiv über Micro Center für $3.999. Ryzen AI Max+ 395 (16C/32T Zen 5, bis 5.1 GHz), 128 GB LPDDR5X-8000, Radeon 8060S iGPU (40 RDNA 3.5 CUs), 50 TOPS XDNA 2 NPU, 2 TB PCIe Gen4 NVMe. 5.9×5.9×1.7 inch (kleiner als Mac Mini Pro), Wi-Fi 7, BT 5.4, HDMI 2.1b, 10 GbE. TDP 45-120W, Standard 55W. OHNE OS — Win ODER Linux (direkter Konter gegen Linux-only DGX Spark). 6-Monats-Amortisation durch Cloud-Einsparungen. Modelle bis 200B Parameter lokal (GPT-OSS 120B, Qwen 3.5 122B).
HOCH — Direkt konkurrierendes Produkt zur razzfazz.ai Box (gleicher Chip, gleicher RAM, gleicher Formfaktor). Preis $3.999 und 6-Monats-Narrativ sind 1:1 die razzfazz.ai-Verkaufsargumente — AMD validiert Market Fit aber schafft Konkurrenzdruck. Differenzierung schärfen: vorinstallierter Stack, GDPR, EU-Lieferung, lokaler Support.
07.05.2026
·KitGuru·erfasst 22.05.2026
AMD bestätigt Hardware-Refresh in Q3 2026 mit Ryzen AI Max PRO 400 Series. Zentrale Neuerung: aktualisierte Memory-Controller die bis **192 GB LPDDR5X Unified Memory** unterstützen (statt 128 GB), wovon bis **160 GB als VRAM** reservierbar sind. Höhere Clocks (Flagship 5.2 GHz statt 5.1 GHz) und LPDDR5X-8533 statt -8000. Codename 'Gorgon Halo' — kein neues Silizium, Refresh auf gleicher Zen 5 + RDNA 3.5 Basis im 4nm. Systeme von ASUS, HP, Lenovo ab Q3 2026.
GAME CHANGER für razzfazz.ai Box V2. 192 GB + 160 GB VRAM macht 200B+ MoE-Modelle (DeepSeek V3, Qwen3-235B-A22B) lokal nativ lauffähig — ohne Quantisierung auf <4bit. Strategisch: Box V2 Roadmap auf Q3/Q4 2026 ausrichten. Marketing: '192 GB unified memory' wird das wichtigste Spec-Differenzierungsmerkmal.
22.01.2026
·Phoronix·erfasst 22.05.2026
Phoronix testet ROCm 7.0 auf Ryzen AI Max+ 395 mit Radeon 8060S (Ubuntu 24.04.3 LTS, Linux 6.14, AMDGPU DKMS). ROCm 7.0 stabil, llama.cpp Vulkan vs ROCm verglichen, vLLM funktioniert. Erkenntnisse: (1) amd_iommu=off bringt 5-12% Performance. (2) Kernel <6.18.4 hat gfx1151-Stabilitätsbug — Upgrade Pflicht. (3) Für llama.cpp: Build mit -DGGML_HIP_ROCWMMA_FATTN=ON und ROCBLAS_USE_HIPBLASLT=1 empfohlen; rocWMMA-Pfad bekommt pending Rewrite kein Update und ist bei langem Context langsamer als regulärer ROCm/HIP.
DIREKT relevant für razzfazz.ai Box Production. Stack läuft auf Kernel 6.18.x + ROCm 7.2 + Ubuntu 24.04 LTS — alles in offiziell unterstütztem Bereich. amd_iommu=off Optimierung prüfen: 5-12% gratis Performance.
06.01.2026
·ServeTheHome·erfasst 22.05.2026
Zwei neue SKUs erweitern Lineup nach unten. **Max+ 392**: 12C/24T Zen 5, bis 5.0 GHz, 76 MB Cache, 50 TOPS NPU, voller Radeon 8060S iGPU (40 CUs). **Max+ 388**: 8C/16T, bis 5.0 GHz, gleicher iGPU, gleicher NPU. Beide volle 256 GB/s Unified Memory Bandbreite und bis 128 GB. Verfügbarkeit Q1 2026. Erste Benchmarks: Max+ 392 in ASUS TUF Gaming A14 schneller als Ryzen 9 7900X Desktop bei MultiCore.
Eröffnet razzfazz.ai Box 'Lite'-Konfiguration: 8C + voller 40-CU iGPU + 128 GB RAM zu signifikant niedrigerem Chip-Preis. Für KI-Inferenz-only-Kunden ist CPU-Power irrelevant — 388 könnte beste Preis/Performance-Profil bekommen.
15.11.2025
·strixhalo.wiki·erfasst 22.05.2026
Community-Wiki publiziert llama.cpp Benchmarks für Qwen3 30B-A3B-UD-Q4_K_XL. **Vulkan (pp512/tg128)**: AMDVLK 741.60/81.79 t/s, RADV 755.14/85.11 t/s. **ROCm**: Standard 650.59/64.17 t/s, mit hipBLASlt 651.93/63.95, Tuned 659.07/67.66. **Long-Context (128K depth)**: Bild dreht sich — Tuned ROCm 51.12/13.32 t/s, RADV 17.24/12.54, AMDVLK nur 10.75/3.51. Bottom: Vulkan (RADV) = Default für Standard, Tuned ROCm gewinnt bei langen Contexten. Power-Modes: 85W ist Sweet Spot.
VALIDIERT razzfazz.ai Stack-Architektur (M022). Vulkan als Default + ROCm-Alternative für Long-Context = genau die richtige Konfiguration. Datenpunkt für Kunden-Pitches und Tuning-Entscheidungen.
15.10.2025
·strixhalo.wiki·erfasst 22.05.2026
Ende 2025/Anfang 2026 über 10 Geräte ausgereift. **GMKtec EVO-X2** ($1.499 für 128 GB) Default-Empfehlung — günstigste vollausgestattete Box. **Beelink GTR9 Pro** ($1.999) — Mac-Studio-Optik, 4 Front-Mikros. **Framework Desktop** (~$2.499) — Mini-ITX 4.5L, enterprise, repairable, OSS-Firmware, im Stresstest nur 144W (vs EVO-X2 186W), Linux-best-in-class laut Phoronix. **HP Z2 Mini G1a** — Enterprise-Workstation. Sapphire zeigt sogar Dual-Unit-Cluster für 235B Modelle.
Marktkonsolidierung — razzfazz.ai Box konkurriert direkt mit GMKtec/Beelink/Framework. Differenzierung über vorinstallierten Stack, EU-Compliance, Service. Framework Desktop als Linux-Best-Box = direkte technische Benchmark. Watch: Sapphire Dual-Cluster — möglicher 'Cluster Box' Roadmap-Punkt.