Gemma 4 in Android AICore Developer Preview verfügbar
Für razzfazz.ai weniger relevant (Server-Stack), aber wichtiges Signal: Google pusht Gemma als On-Device-Standard.
Google DeepMind hat am 02.04.2026 Gemma 4 veröffentlicht — vierte Generation der offenen Gemma-Modellfamilie, auf gleicher Forschung wie Gemini 3. Vier Varianten: E2B (2.3B effective), E4B (4.5B effective), 26B A4B (MoE mit 4B aktiv) und 31B Dense. Context bis 256K Tokens, native Multimodalität (Text/Bild/Video alle Modelle, Audio nur E2B/E4B), 140+ Sprachen. **WICHTIGSTE Änderung: Apache 2.0 Lizenz** — endlich keine Gemma-spezifischen Restriktionen, voll kommerziell nutzbar ohne MAU-Limits. 31B-Modell rangiert #3 auf LMArena Open-Model-Leaderboard mit ~1452 Elo. Day-0-Support für llama.cpp, MLX, transformers, mistral.rs, LM Studio, Ollama.
Gemma ist Googles offene Modellfamilie als Gegenstück zu Llama (Meta) und Qwen (Alibaba). Wechsel zu Apache 2.0 ist eigentlicher Game-Changer für kommerzielle Deployments. E-Modelle nutzen Per-Layer Embeddings und Shared KV Cache → effektive RAM-Footprints deutlich unter Total-Parametern.
Für razzfazz.ai weniger relevant (Server-Stack), aber wichtiges Signal: Google pusht Gemma als On-Device-Standard.
DIREKT deploybar auf razzfazz.ai Box (128 GB, ROCm 7.2). 26B A4B MoE besonders interessant: 4B aktive Parameter bei Qualität nahe 31B Dense — perfekter Fit. Sollte auf llama-box-vulkan-custom und llama-box-rocm-custom getestet werden.
**HOCHRELEVANT für razzfazz.ai.** Apache 2.0 beseitigt letzte rechtliche Hürde für Gemma in kommerziellen Box-Deployments — bisher war Gemma wegen Custom-Lizenz problematisch für Kunden wie WKO/PSA/CareSolutions. 26B A4B MoE könnte neues Default-Modell für die Box werden.