News-Verlauf
Die Apache-2.0-lizenzierte Mistral Vibe CLI (github.com/mistralai/mistral-vibe) hat innerhalb von drei Wochen die Versionen 2.9.4 (5. Mai), 2.9.5 (7. Mai), 2.9.6 (11. Mai), 2.10.0 (19. Mai) und schließlich 2.10.1 (20. Mai) als Stable-Releases ausgeliefert. Die 2.10er-Serie bringt formatierte, menschenlesbare Session-Titles mit @-Mention-Syntax, robustere Parallel-Tool-Operationen im Terminal, syntax-hervorgehobene File-Diffs für write_file und search_replace im IDE-Agent-Webview sowie verbesserte Bash-Allowlist-Patterns. Vibe läuft lokal oder gegen einen selbstgehosteten Devstral-2-/Medium-3.5-Endpoint und spricht über das Agent Communication Protocol mit IDEs. Damit ist Vibe der zur Zeit aktivste vollständig quelloffene CLI-Coding-Agent eines Frontier-Labs und ein direkter Open-Source-Gegenentwurf zu Claude Code und Codex CLI.
hoch — perfektes Werkzeug für die razzfazz.ai Box: Open Source, läuft gegen lokale Mistral-Endpoints, DSGVO-konform, regelmäßige Updates
19.05.2026
·CNBC·erfasst 23.05.2026
Die CNBC Disruptor-50-Liste 2026 listet Mistral als einzigen europäischen Frontier-Lab-Vertreter auf Platz 7. Im Januar 2026 lag der annualisierte Umsatz-Runrate bereits bei über $400 Mio. (gegenüber $20 Mio. ein Jahr zuvor), für Jahresende 2026 peilt CEO Arthur Mensch die $1-Mrd.-Schwelle an. Treiber sind laut CNBC die konsequente Open-Weights-Strategie (Mistral 3, Large 3, Small 4, Medium 3.5, Voxtral TTS, Devstral 2 alle unter Apache 2.0 bzw. Modified MIT), das im März angekündigte $830-Mio.-Debt-Financing für ein neues Pariser Rechenzentrum-Cluster sowie Forge für Custom-Enterprise-Modelle. Neue Büros in Singapur und (geplant) Indien sollen die Reichweite über Europa hinaus tragen. Für razzfazz.ai bestätigt das: Mistral als Modell-Lieferant ist wirtschaftlich solide und wird weiterhin Open Weights veröffentlichen.
mittel — strategische Bestätigung, dass Mistrals Open-Weights-Kurs business-getragen ist und nicht abrupt kippt
02.05.2026
·InfoQ·erfasst 23.05.2026
Zusammen mit Medium 3.5 hat Mistral einen neuen Work Mode in Le Chat und das kommerzielle Le Chat Enterprise gelauncht. Work Mode routet komplexe Mehrschritt-Aufgaben (Research, Dokumenten-Drafting, strukturierte Analysen) automatisch auf Medium 3.5 mit aktiviertem Extended Reasoning. Der Agent verbindet sich direkt mit Mails, Kalendern und Enterprise-Tools über eingebaute Konnektoren, zeigt Tool-Calls und Zwischenschritte transparent an und verlangt explizite Freigabe für sensible Aktionen. Le Chat Enterprise zielt auf europäische Kunden mit Datenresidenz-Garantien, On-Premises-Deployment, Custom-Integrationen und dediziertem Support; Einstiegspreise liegen laut Branchenberichten bei rund $20.000/Monat. Da das zugrundeliegende Medium-3.5-Modell als Open Weights unter Modified MIT Lizenz verfügbar ist, lässt sich derselbe Stack auch ohne Mistral-SaaS reproduzieren.
mittel — Work Mode zeigt, wie Medium 3.5 als Agenten-Backbone genutzt wird; relevant als Referenz-Architektur für lokale GDPR-Setups
29.04.2026
·MarkTechPost·erfasst 22.05.2026
Dichtes 128B Transformermodell mit 256k Context unter modifizierter MIT-Lizenz (mistralai/Mistral-Medium-3.5-128B). Vereint Medium 3.1, Magistral und Devstral 2 in einem Modell — Coding, Reasoning, Vision, Allgemein. SWE-Bench Verified 77.6% (vs Devstral 2 72.2%, vs Qwen 3.5 397B A17B besser). τ³-Telecom 91.4. API: $1.50/$7.50 pro Million In/Out. Self-Hosting mit 4 GPUs möglich. Parallel 'Vibe Remote Agents' — Coding-Agents in Mistrals Cloud für komplexe Multi-File-Tasks ohne lokale Ressourcen.
TOP-Kandidat für razzfazz.ai Box als nächstes Coding-/Reasoning-Modell — Open Weights, 128B dense passt auf 128GB Unified Memory mit Quantisierung, schlägt Devstral 2 deutlich. Lizenz-Check (modifizierte MIT) vor kommerziellem Rollout nötig.
26.03.2026
·TechCrunch·erfasst 22.05.2026
Erstes Open-Weight Text-to-Speech-Modell. Hybride Architektur 3-4B Parameter, 9 Sprachen: EN, FR, DE, ES, NL, PT, IT, HI, AR. Voice-Cloning mit nur 3s Referenz-Audio, ohne Fine-Tuning. Time-to-First-Audio 90ms — Real-Time auf Consumer-Hardware. Schlägt ElevenLabs Flash v2.5 in Human-Preference-Tests. API $0.016/1k Zeichen; Open Weights auf HF unter **CC BY NC 4.0** (nicht-kommerziell!). Positioniert gegen ElevenLabs, Deepgram, OpenAI.
Interessant für razzfazz.ai Stack (Speaches v0.8.3 könnte um TTS erweitert werden) — aber CC BY NC 4.0 verhindert kommerzielle Nutzung auf Kunden-Boxen. Nur für interne/Demo.
16.03.2026
·Mistral AI·erfasst 22.05.2026
Mistral Small 4 (Mistral-Small-4-119B-2603) unter Apache 2.0. MoE 119B Total / 128 Experten / 4 aktive pro Token = ~6B aktive Parameter (8B inkl. Embedding/Output). Context 256k. Vereint Magistral (Reasoning), Pixtral (Vision) und Devstral (Coding) in einer Architektur. Konfigurierbarer Reasoning-Effort (none/high). 40% Reduktion E2E-Latenz, 3× mehr Requests/s vs Small 3. Schlägt GPT-OSS 120B auf AIME 2025, LCR und LiveCodeBench bei 20% kürzerem Output.
SEHR relevant für razzfazz.ai Box — Apache 2.0 kommerziell nutzbar, MoE mit nur 6B aktiv = extrem effizient auf 128GB-Box. Vereint drei Use-Cases in einem Modell, reduziert VRAM-Druck bei Multi-Use-Case-Setups.