← Mein Newsfeed newsfeed.avintaris.com
🤖 Open Source AI Modelle

🔺 Qwen Open Source Modelle

Alibabas Qwen-Team hat 2026 extrem hohes Release-Tempo gefahren und sich als #1 OSS-Familie aus China etabliert. Februar: Qwen3.5-Serie (122B-A10B, 35B-A3B, 27B) unter Apache 2.0 mit MoE+Gated-DeltaNet. April: Qwen3.6 mit dichtem 27B-Coder (SWE-Bench 77.2) und 35B-A3B Sparse-MoE. Qwen3-Coder-Next (80B-Total/3B-Active) Apache 2.0 mit 70.6 SWE-Bench. Mai (Cloud Summit): Qwen3.7-Max — closed-weight, 1M-Token-Context, Platz 5 Intelligence Index. Lizenz-Strategie: Open für ≤122B, Max/Plus-Flagships proprietär.

Qwen ist Alibabas LLM-Familie und Open-Source-Champion Chinas. 2026: schnelle Punkt-Release-Kadenz (3.5 → 3.6 → 3.7) mit Hybrid-MoE (Gated DeltaNet + Sparse Attention) und Agentic-Coding-Fokus.

7 News · Letzte: 2026-05-21 📡 RSS
News-Verlauf

Qwen3.7-Plus-Preview hebt Alibaba auf #5 in der Vision Arena

Parallel zum Qwen3.7-Max-Launch hat Alibaba die multimodale Preview-Variante Qwen3.7-Plus-Preview in der LM Arena freigeschaltet. Innerhalb einer Woche nach Soft-Launch kletterte das Modell auf Platz 16 im Vision-Ranking und macht Alibaba damit zum #5-Lab in der Vision-Arena (weltweit) — der bislang beste Wert eines chinesischen Anbieters. Qwen3.7-Plus ist die multimodale Schwester zu Max: Vision-Input, OCR-at-scale, Chart-/Diagram-Reasoning und Video-Frame-Analyse. Die offizielle Qwen-Ankündigung auf X (@Alibaba_Qwen) bestätigt: 'Qwen3.7 Preview lands on Arena — Alibaba now #6 lab in Text, #5 in Vision'. Beide Preview-Varianten sind aktuell Closed-Weights und nur über API/Qwen Chat zugänglich. Laut mehreren Trackern (codersera, aimadetools) hat Alibaba aber bei früheren Releases (3.5, 3.6) den API-First-Pfad gewählt und Open-Weights 3-4 Wochen später nachgereicht — entsprechend wird ein Plus/Max-Open-Weight-Drop für Juni/Juli erwartet. Bis dahin bleibt Qwen3.6-35B-A3B-FP8 das aktuellste Open-Weight-Flagship auf HuggingFace.
mittel — multimodale Open-Weights wären für razzfazz.ai-Pipelines hochrelevant, kommen aber laut historischem Muster erst in 4-6 Wochen; Vision-Arena-#5 zeigt, wohin sich der Open-Stack als nächstes bewegt

Alibaba bündelt Qwen3.7-Max mit Zhenwu-M890-Chip und T-Head-Stack

TechNode berichtet, dass Alibaba auf dem Apsara Cloud Summit Qwen3.7-Max nicht isoliert, sondern als Teil eines vertikal integrierten Agent-Stacks vorgestellt hat: neuer Zhenwu-M890-Inferenz-Chip von T-Head, aufgerüstete Cloud-Infrastruktur und Qwen3.7-Max-Preview als 'next-gen AI agent model'. Der Fokus liegt explizit auf 'long-horizon autonomous execution' — Alibaba behauptet, Qwen3.7-Max könne bis zu 35 Stunden ohne Performance-Degradation autonom operieren. Während Max closed-weight bleibt, betont Alibaba weiter sein 'Open-Source-Champion'-Narrativ: Plus wird laut Vorab-Briefings (gncrypto, startupfortune) als Open-Source-Variante geplant, jedoch noch ohne kommittiertes Datum. Strategisch wichtig: Alibaba positioniert sich damit als Chinas vertikal integrierte 'AI-Factory' (vergleichbar zu Nvidia + OpenAI in einem Konzern). Für die OSS-Community bedeutet das: mehr Druck auf Open-Weights als Marketing-Vehikel, aber zunehmend gestaffelte Releases (Max closed, Plus/Coder open).
mittel — Hardware-Lock-in (Zhenwu-Chip) ist für razzfazz.ai irrelevant, aber das Open/Closed-Split-Modell (Plus offen, Max zu) ist Vukos Lizenz-Radar wert; 35h-Agent-Claims sind Marketing, müssen unabhängig verifiziert werden

Qwen3.7-Max auf Alibaba Cloud Summit — 1M-Context, aber closed-source

Reasoning-Agent mit 1M Token Context Window (doppelt vs 256K bei Qwen3.6-Max-Preview), Extended-Thinking-Modus. AI Intelligence Index v4.0 = 56.6 (Platz 5 global, #1 Chinese). GPQA Diamond 92.4 (schlägt Claude Opus 4.6 Max 91.3), Apex Reasoning 44.5 vs DeepSeek V4 Pro 38.3, Terminal-Bench Hard 50.8%, Hallucination 22.9% (niedrigste unter Frontier). Pricing: $2.50/$7.50 pro 1M In/Out. WICHTIG: Closed-Weight, nur via Alibaba Cloud API.
Closed-source — für razzfazz.ai Box irrelevant. Aber zeigt Trend: Alibaba zieht Top-Modelle proprietär. OSS-Strategie endet bei 122B-Klasse.

Qwen3.6-27B — dichtes 27B-Modell schlägt 397B-MoE auf Agentic Coding

Apache 2.0 auf HF und ModelScope. 27B dense, 64 Layer, Hybrid (Gated DeltaNet linear O(n) + Sparse Attention). SWE-Bench Verified 77.2 (Claude 4.5 Opus: 80.9), SWE-Bench Pro 53.5 (übertrifft Qwen3.5-397B-A17B 50.9), Terminal-Bench 2.0 59.3 (matched Claude 4.5 Opus), SkillsBench Avg5 48.2 (+77% vs Qwen3.5-27B), QwenWebBench 1487, GPQA Diamond 87.8, AIME26 94.1. Context: 262K nativ, via YaRN bis 1.01M. preserve_thinking Parameter behält Reasoning-Traces über Conversation. Multi-Token-Prediction für Speculative Decoding.
HEISSER KANDIDAT für razzfazz.ai Box. 27B Dense passt in 128GB Unified Memory mit Reserve. Coding auf Claude 4.5 Opus Niveau bei Apache 2.0. Für Coder-Buddy direkt evaluieren — könnte Qwen3-Coder ablösen.

Qwen3.6-35B-A3B — Agentic Coding Power als Sparse MoE

Apache 2.0. 35B Total / ~3B Active. Terminal-Bench 2.0 51.5, SWE-Bench Verified 73.4. Optimiert für agentische Workflows, Repository-Level Reasoning, Frontend. Niedrigere Inferenz-Kosten als Dense-27B durch Sparse-Activation — ideal für High-Throughput.
Alternative zum Dense-27B wenn höherer Durchsatz nötig. Sparse-MoE läuft auf Box gut, nur ~3B aktiv = niedrige Memory-Bandwidth. Für GPUStack-Deployment testen.

Qwen3.5-Serie Vollrelease — 122B-A10B als neues Open-Source-Flagship

Drei Modelle: Qwen3.5-122B-A10B (122B Total / 10B Active, 256 Experts), 35B-A3B, 27B. Apache 2.0. Hybrid: Gated Delta Networks + Sparse MoE. Flagship (122B-A10B): MMLU-Pro 86.1%, GPQA Diamond 85.5%, SWE-Bench Verified 72.4%, Terminal-Bench 2.0 41.6%/49.4%, BFCL-V4 72.2, BrowseComp 63.8. Context: 262K nativ, bis 1M via YaRN. Thinking + Non-Thinking. 201 Sprachen.
Open-Source-Flagship. 122B-A10B FP8 ≈ 122GB → grenzwertig für Box, eher 35B-A3B praxistauglich.

Qwen3-Coder-Next — 80B-Total/3B-Active Sparse-MoE Coder unter Apache 2.0

Apache 2.0. 80B Total / 3B Active (Hybrid, 48 Layer, Gated DeltaNet + Gated Attention + MoE, 512 Experts mit 10 aktivierten pro Token). SWE-Bench Verified 70.6%, SWE-Bench Pro 44.3%, Terminal-Bench 2.0 36.2%, CWEval func-sec@1 56.32% (schlägt DeepSeek-V3.2 und GLM-4.7). Context 256K. Non-Thinking-Modus (kein Overhead). Native Integration mit Claude Code, Qwen Code, Cline. 3B Active = 10× höherer Throughput für Repository-Tasks. NIM/SGLang/vLLM.
PRAKTISCH IDEAL für razzfazz.ai Box als Coder-Modell. 80B Sparse-MoE = niedrige Active-Memory-Bandwidth, läuft mit vLLM, Apache 2.0 für kommerzielle Buddy-Templates. Direkt mit Qwen3.6-27B Dense vergleichen.
← zurück zum Dashboard