← Mein Newsfeed newsfeed.avintaris.com
🤖 Open Source AI Modelle

🔺 Mistral Open Source Modelle

Mistral hat Ende April / Anfang Mai 2026 sein neues Flaggschiff Mistral Medium 3.5 als Open-Weights-Modell veroeffentlicht: ein dichtes 128B-Modell mit 256k Kontextfenster, das Instruction-Following, Reasoning und Coding in einem Modellsatz buendelt. Lizenz ist eine 'Modified MIT License' (Apache-2.0-aehnlich, aber mit Carve-out fuer Hochumsatz-Konzerne). Es erreicht 77,6% auf SWE-Bench Verified und 91,4% auf tau3-Telecom, ersetzt Mistral Medium 3.1, Magistral und Devstral 2 im Le-Chat- und Vibe-Stack und ist auf Hugging Face (mistralai/Mistral-Medium-3.5-128B) verfuegbar. Parallel hat Mistral Remote Agents in Vibe (asynchrone Cloud-Coding-Agents mit Konnektoren fuer Linear, Jira, Sentry, Slack, Teams) und einen neuen Work Mode in Le Chat sowie Le Chat Enterprise gestartet. API-Preise liegen bei $0,40 Input / $2,00 Output pro Mio. Token; einige Quellen nennen abweichend $1,50 / $7,50.

Französischer Open-Source AI-Champion, einer der wenigen europäischen Frontier-Labs. Modelle sind Hauptbasis für GDPR-konforme lokale AI-Setups wie razzfazz.ai Box. März 2026: zusätzlich $830M Debt Financing für Pariser Datacenter.

6 News · Letzte: 2026-05-20 📡 RSS
News-Verlauf

Mistral Vibe CLI 2.10.1 — Open-Source-Coding-Agent mit Session-Titles und Parallel-Tool-Calls

Die Apache-2.0-lizenzierte Mistral Vibe CLI (github.com/mistralai/mistral-vibe) hat innerhalb von drei Wochen die Versionen 2.9.4 (5. Mai), 2.9.5 (7. Mai), 2.9.6 (11. Mai), 2.10.0 (19. Mai) und schließlich 2.10.1 (20. Mai) als Stable-Releases ausgeliefert. Die 2.10er-Serie bringt formatierte, menschenlesbare Session-Titles mit @-Mention-Syntax, robustere Parallel-Tool-Operationen im Terminal, syntax-hervorgehobene File-Diffs für write_file und search_replace im IDE-Agent-Webview sowie verbesserte Bash-Allowlist-Patterns. Vibe läuft lokal oder gegen einen selbstgehosteten Devstral-2-/Medium-3.5-Endpoint und spricht über das Agent Communication Protocol mit IDEs. Damit ist Vibe der zur Zeit aktivste vollständig quelloffene CLI-Coding-Agent eines Frontier-Labs und ein direkter Open-Source-Gegenentwurf zu Claude Code und Codex CLI.
hoch — perfektes Werkzeug für die razzfazz.ai Box: Open Source, läuft gegen lokale Mistral-Endpoints, DSGVO-konform, regelmäßige Updates

Mistral auf Platz 7 der CNBC Disruptor 50 — $400M ARR und expansive Open-Weights-Strategie

Die CNBC Disruptor-50-Liste 2026 listet Mistral als einzigen europäischen Frontier-Lab-Vertreter auf Platz 7. Im Januar 2026 lag der annualisierte Umsatz-Runrate bereits bei über $400 Mio. (gegenüber $20 Mio. ein Jahr zuvor), für Jahresende 2026 peilt CEO Arthur Mensch die $1-Mrd.-Schwelle an. Treiber sind laut CNBC die konsequente Open-Weights-Strategie (Mistral 3, Large 3, Small 4, Medium 3.5, Voxtral TTS, Devstral 2 alle unter Apache 2.0 bzw. Modified MIT), das im März angekündigte $830-Mio.-Debt-Financing für ein neues Pariser Rechenzentrum-Cluster sowie Forge für Custom-Enterprise-Modelle. Neue Büros in Singapur und (geplant) Indien sollen die Reichweite über Europa hinaus tragen. Für razzfazz.ai bestätigt das: Mistral als Modell-Lieferant ist wirtschaftlich solide und wird weiterhin Open Weights veröffentlichen.
mittel — strategische Bestätigung, dass Mistrals Open-Weights-Kurs business-getragen ist und nicht abrupt kippt

Le Chat bekommt Work Mode und Le Chat Enterprise startet auf Medium 3.5

Zusammen mit Medium 3.5 hat Mistral einen neuen Work Mode in Le Chat und das kommerzielle Le Chat Enterprise gelauncht. Work Mode routet komplexe Mehrschritt-Aufgaben (Research, Dokumenten-Drafting, strukturierte Analysen) automatisch auf Medium 3.5 mit aktiviertem Extended Reasoning. Der Agent verbindet sich direkt mit Mails, Kalendern und Enterprise-Tools über eingebaute Konnektoren, zeigt Tool-Calls und Zwischenschritte transparent an und verlangt explizite Freigabe für sensible Aktionen. Le Chat Enterprise zielt auf europäische Kunden mit Datenresidenz-Garantien, On-Premises-Deployment, Custom-Integrationen und dediziertem Support; Einstiegspreise liegen laut Branchenberichten bei rund $20.000/Monat. Da das zugrundeliegende Medium-3.5-Modell als Open Weights unter Modified MIT Lizenz verfügbar ist, lässt sich derselbe Stack auch ohne Mistral-SaaS reproduzieren.
mittel — Work Mode zeigt, wie Medium 3.5 als Agenten-Backbone genutzt wird; relevant als Referenz-Architektur für lokale GDPR-Setups

Mistral Medium 3.5 — 128B Dense Model mit 77.6% SWE-Bench Verified

Dichtes 128B Transformermodell mit 256k Context unter modifizierter MIT-Lizenz (mistralai/Mistral-Medium-3.5-128B). Vereint Medium 3.1, Magistral und Devstral 2 in einem Modell — Coding, Reasoning, Vision, Allgemein. SWE-Bench Verified 77.6% (vs Devstral 2 72.2%, vs Qwen 3.5 397B A17B besser). τ³-Telecom 91.4. API: $1.50/$7.50 pro Million In/Out. Self-Hosting mit 4 GPUs möglich. Parallel 'Vibe Remote Agents' — Coding-Agents in Mistrals Cloud für komplexe Multi-File-Tasks ohne lokale Ressourcen.
TOP-Kandidat für razzfazz.ai Box als nächstes Coding-/Reasoning-Modell — Open Weights, 128B dense passt auf 128GB Unified Memory mit Quantisierung, schlägt Devstral 2 deutlich. Lizenz-Check (modifizierte MIT) vor kommerziellem Rollout nötig.

Voxtral TTS — Open-Weight Speech-Synthese mit 9 Sprachen

Erstes Open-Weight Text-to-Speech-Modell. Hybride Architektur 3-4B Parameter, 9 Sprachen: EN, FR, DE, ES, NL, PT, IT, HI, AR. Voice-Cloning mit nur 3s Referenz-Audio, ohne Fine-Tuning. Time-to-First-Audio 90ms — Real-Time auf Consumer-Hardware. Schlägt ElevenLabs Flash v2.5 in Human-Preference-Tests. API $0.016/1k Zeichen; Open Weights auf HF unter **CC BY NC 4.0** (nicht-kommerziell!). Positioniert gegen ElevenLabs, Deepgram, OpenAI.
Interessant für razzfazz.ai Stack (Speaches v0.8.3 könnte um TTS erweitert werden) — aber CC BY NC 4.0 verhindert kommerzielle Nutzung auf Kunden-Boxen. Nur für interne/Demo.

Mistral Small 4 — 119B MoE vereint Reasoning, Vision und Coding

Mistral Small 4 (Mistral-Small-4-119B-2603) unter Apache 2.0. MoE 119B Total / 128 Experten / 4 aktive pro Token = ~6B aktive Parameter (8B inkl. Embedding/Output). Context 256k. Vereint Magistral (Reasoning), Pixtral (Vision) und Devstral (Coding) in einer Architektur. Konfigurierbarer Reasoning-Effort (none/high). 40% Reduktion E2E-Latenz, 3× mehr Requests/s vs Small 3. Schlägt GPT-OSS 120B auf AIME 2025, LCR und LiveCodeBench bei 20% kürzerem Output.
SEHR relevant für razzfazz.ai Box — Apache 2.0 kommerziell nutzbar, MoE mit nur 6B aktiv = extrem effizient auf 128GB-Box. Vereint drei Use-Cases in einem Modell, reduziert VRAM-Druck bei Multi-Use-Case-Setups.
← zurück zum Dashboard