<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>Mein Newsfeed — Gemma 4</title>
<link>https://newsfeed.avintaris.com</link>
<description>News zum Thema Gemma 4</description>
<language>de</language>
<lastBuildDate>Fri, 22 May 2026 21:22:05 +0000</lastBuildDate>
<item>
<title>Gemma 4: Gemma 4 in Android AICore Developer Preview verfügbar</title>
<link>https://android-developers.googleblog.com/2026/04/AI-Core-Developer-Preview.html</link>
<guid isPermaLink="false">https://android-developers.googleblog.com/2026/04/AI-Core-Developer-Preview.html</guid>
<pubDate>Wed, 15 Apr 2026 12:00:00 +0000</pubDate>
<category>Gemma 4</category>
<description>Google integriert Gemma 4 (E2B/E4B) in Android System AICore Service — Apps können geräteübergreifend offline Inferenz nutzen. Vision und Audio (E2B/E4B) nativ supported. Erste Pixel-Geräte als Developer Preview, Rollout auf weitere OEMs H2/2026. Function-Calling und JSON-Output direkt im AICore-API exponiert — relevant für agentische On-Device-Workflows. Vergleich zu Gemma 3n: doppelter Context, +15 Punkte MMLU Pro für E4B.</description>
</item>
<item>
<title>Gemma 4: Day-0 Support in llama.cpp, MLX, LM Studio und Ollama</title>
<link>https://huggingface.co/blog/gemma4</link>
<guid isPermaLink="false">https://huggingface.co/blog/gemma4</guid>
<pubDate>Fri, 03 Apr 2026 12:00:00 +0000</pubDate>
<category>Gemma 4</category>
<description>Direkt am Folgetag: GGUF-Quants (Q4_K_M und alle Präzisionen). llama.cpp-Server mit OpenAI-kompatibler API ready, MLX mit voller Multimodal-Unterstützung inkl. TurboQuant (~4× weniger aktiver Memory). mistral.rs unterstützt alle Modalitäten + Tool-Calling. Speculative-Decoding-Drafter für alle vier Größen mit bis zu ~3× End-to-End-Speedup. Hardware: E2B ~10GB GPU, E4B ~16GB, 26B A4B nur ~8GB aktiv (MoE-Vorteil), 31B ~62GB GPU oder 96GB+ CPU-RAM.</description>
</item>
<item>
<title>Gemma 4: Gemma 4 offiziell veröffentlicht — Apache 2.0 Lizenz und vier Modellgrößen</title>
<link>https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/</link>
<guid isPermaLink="false">https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/</guid>
<pubDate>Thu, 02 Apr 2026 12:00:00 +0000</pubDate>
<category>Gemma 4</category>
<description>Vier Varianten: E2B (2.3B effective / 5.1B total), E4B (4.5B effective / 8B total), 26B A4B (MoE, 4B aktiv) und 31B Dense. Alle multimodal Text/Bild/Video, E2B/E4B mit Audio. Context: 128K für Edge, 256K für 26B/31B. 140+ Sprachen. Architektur: alternierende Attention (sliding 512-1024 + global), Dual RoPE, Per-Layer Embeddings (PLE), Shared KV Cache, USM-style Conformer Audio Encoder. Benchmarks (31B IT): MMLU Pro 85.2%, AIME 2026 89.2%, GPQA Diamond 84.3%, LiveCodeBench v6 80.0%, Codeforces ELO 2150, MMMU Pro 76.9%. 26B A4B: MMLU Pro 82.6%, AIME 88.3%. **LIZENZWECHSEL:** weg von 'Gemma Terms of Use', hin zu Apache 2.0.</description>
</item>
</channel>
</rss>
