News-Verlauf
21.05.2026
·Codersera·erfasst 23.05.2026
Parallel zum Qwen3.7-Max-Launch hat Alibaba die multimodale Preview-Variante Qwen3.7-Plus-Preview in der LM Arena freigeschaltet. Innerhalb einer Woche nach Soft-Launch kletterte das Modell auf Platz 16 im Vision-Ranking und macht Alibaba damit zum #5-Lab in der Vision-Arena (weltweit) — der bislang beste Wert eines chinesischen Anbieters. Qwen3.7-Plus ist die multimodale Schwester zu Max: Vision-Input, OCR-at-scale, Chart-/Diagram-Reasoning und Video-Frame-Analyse. Die offizielle Qwen-Ankündigung auf X (@Alibaba_Qwen) bestätigt: 'Qwen3.7 Preview lands on Arena — Alibaba now #6 lab in Text, #5 in Vision'. Beide Preview-Varianten sind aktuell Closed-Weights und nur über API/Qwen Chat zugänglich. Laut mehreren Trackern (codersera, aimadetools) hat Alibaba aber bei früheren Releases (3.5, 3.6) den API-First-Pfad gewählt und Open-Weights 3-4 Wochen später nachgereicht — entsprechend wird ein Plus/Max-Open-Weight-Drop für Juni/Juli erwartet. Bis dahin bleibt Qwen3.6-35B-A3B-FP8 das aktuellste Open-Weight-Flagship auf HuggingFace.
mittel — multimodale Open-Weights wären für razzfazz.ai-Pipelines hochrelevant, kommen aber laut historischem Muster erst in 4-6 Wochen; Vision-Arena-#5 zeigt, wohin sich der Open-Stack als nächstes bewegt
21.05.2026
·TechNode·erfasst 23.05.2026
TechNode berichtet, dass Alibaba auf dem Apsara Cloud Summit Qwen3.7-Max nicht isoliert, sondern als Teil eines vertikal integrierten Agent-Stacks vorgestellt hat: neuer Zhenwu-M890-Inferenz-Chip von T-Head, aufgerüstete Cloud-Infrastruktur und Qwen3.7-Max-Preview als 'next-gen AI agent model'. Der Fokus liegt explizit auf 'long-horizon autonomous execution' — Alibaba behauptet, Qwen3.7-Max könne bis zu 35 Stunden ohne Performance-Degradation autonom operieren. Während Max closed-weight bleibt, betont Alibaba weiter sein 'Open-Source-Champion'-Narrativ: Plus wird laut Vorab-Briefings (gncrypto, startupfortune) als Open-Source-Variante geplant, jedoch noch ohne kommittiertes Datum. Strategisch wichtig: Alibaba positioniert sich damit als Chinas vertikal integrierte 'AI-Factory' (vergleichbar zu Nvidia + OpenAI in einem Konzern). Für die OSS-Community bedeutet das: mehr Druck auf Open-Weights als Marketing-Vehikel, aber zunehmend gestaffelte Releases (Max closed, Plus/Coder open).
mittel — Hardware-Lock-in (Zhenwu-Chip) ist für razzfazz.ai irrelevant, aber das Open/Closed-Split-Modell (Plus offen, Max zu) ist Vukos Lizenz-Radar wert; 35h-Agent-Claims sind Marketing, müssen unabhängig verifiziert werden
20.05.2026
·MarkTechPost·erfasst 22.05.2026
Reasoning-Agent mit 1M Token Context Window (doppelt vs 256K bei Qwen3.6-Max-Preview), Extended-Thinking-Modus. AI Intelligence Index v4.0 = 56.6 (Platz 5 global, #1 Chinese). GPQA Diamond 92.4 (schlägt Claude Opus 4.6 Max 91.3), Apex Reasoning 44.5 vs DeepSeek V4 Pro 38.3, Terminal-Bench Hard 50.8%, Hallucination 22.9% (niedrigste unter Frontier). Pricing: $2.50/$7.50 pro 1M In/Out. WICHTIG: Closed-Weight, nur via Alibaba Cloud API.
Closed-source — für razzfazz.ai Box irrelevant. Aber zeigt Trend: Alibaba zieht Top-Modelle proprietär. OSS-Strategie endet bei 122B-Klasse.
22.04.2026
·MarkTechPost·erfasst 22.05.2026
Apache 2.0 auf HF und ModelScope. 27B dense, 64 Layer, Hybrid (Gated DeltaNet linear O(n) + Sparse Attention). SWE-Bench Verified 77.2 (Claude 4.5 Opus: 80.9), SWE-Bench Pro 53.5 (übertrifft Qwen3.5-397B-A17B 50.9), Terminal-Bench 2.0 59.3 (matched Claude 4.5 Opus), SkillsBench Avg5 48.2 (+77% vs Qwen3.5-27B), QwenWebBench 1487, GPQA Diamond 87.8, AIME26 94.1. Context: 262K nativ, via YaRN bis 1.01M. preserve_thinking Parameter behält Reasoning-Traces über Conversation. Multi-Token-Prediction für Speculative Decoding.
HEISSER KANDIDAT für razzfazz.ai Box. 27B Dense passt in 128GB Unified Memory mit Reserve. Coding auf Claude 4.5 Opus Niveau bei Apache 2.0. Für Coder-Buddy direkt evaluieren — könnte Qwen3-Coder ablösen.
16.04.2026
·GitHub QwenLM·erfasst 22.05.2026
Apache 2.0. 35B Total / ~3B Active. Terminal-Bench 2.0 51.5, SWE-Bench Verified 73.4. Optimiert für agentische Workflows, Repository-Level Reasoning, Frontend. Niedrigere Inferenz-Kosten als Dense-27B durch Sparse-Activation — ideal für High-Throughput.
Alternative zum Dense-27B wenn höherer Durchsatz nötig. Sparse-MoE läuft auf Box gut, nur ~3B aktiv = niedrige Memory-Bandwidth. Für GPUStack-Deployment testen.
24.02.2026
·Artificial Analysis·erfasst 22.05.2026
Drei Modelle: Qwen3.5-122B-A10B (122B Total / 10B Active, 256 Experts), 35B-A3B, 27B. Apache 2.0. Hybrid: Gated Delta Networks + Sparse MoE. Flagship (122B-A10B): MMLU-Pro 86.1%, GPQA Diamond 85.5%, SWE-Bench Verified 72.4%, Terminal-Bench 2.0 41.6%/49.4%, BFCL-V4 72.2, BrowseComp 63.8. Context: 262K nativ, bis 1M via YaRN. Thinking + Non-Thinking. 201 Sprachen.
Open-Source-Flagship. 122B-A10B FP8 ≈ 122GB → grenzwertig für Box, eher 35B-A3B praxistauglich.
03.02.2026
·Hugging Face·erfasst 22.05.2026
Apache 2.0. 80B Total / 3B Active (Hybrid, 48 Layer, Gated DeltaNet + Gated Attention + MoE, 512 Experts mit 10 aktivierten pro Token). SWE-Bench Verified 70.6%, SWE-Bench Pro 44.3%, Terminal-Bench 2.0 36.2%, CWEval func-sec@1 56.32% (schlägt DeepSeek-V3.2 und GLM-4.7). Context 256K. Non-Thinking-Modus (kein Overhead). Native Integration mit Claude Code, Qwen Code, Cline. 3B Active = 10× höherer Throughput für Repository-Tasks. NIM/SGLang/vLLM.
PRAKTISCH IDEAL für razzfazz.ai Box als Coder-Modell. 80B Sparse-MoE = niedrige Active-Memory-Bandwidth, läuft mit vLLM, Apache 2.0 für kommerzielle Buddy-Templates. Direkt mit Qwen3.6-27B Dense vergleichen.