News-Verlauf
Onyx hat am 20. Mai 2026 v3.3.7 als stabiles Release veröffentlicht — laut Release Notes mit 415 Commits seit v3.2.14 und Beiträgen von 19 Contributors. Zentrale Neuerungen sind ein durchsuchbarer Agent-Selector im Slack-Bot, smooth character-level streaming im Chat, scrollable Tables mit Overflow-Fade und ein neuer reCAPTCHA-Schutz für das /auth/login-Endpoint (Enterprise Assessment API). Auf der Indexing-Seite kamen tabellarische Section-Unterstützung, ein CSV-Chunker mit Field-Value-Implementation und Image-Extraction aus PDFs hinzu. Betrieblich wurden Prometheus-Metriken ausgebaut, Grafana-Dashboards für OpenSearch und Redis-Queues sowie zusätzliche ServiceMonitors im Helm-Chart geliefert. Connector-Seitig wurde Gong auf checkpointed Indexing migriert, Google Drive Pruning optimiert sowie Confluence-, SharePoint- und Slack-Connectoren stabilisiert. Admin-Features: globaler Multi-Model-Chat-Toggle, Admin-API für failed documents und ein Query-History-Toggle.
Hoch — Onyx steht laut Stack-Hinweisen als potenzielle Enterprise-Search-/AI-Assistant-Komponente in der Pipeline (onyx-backend/web/model-server v3.2.12 in der Stack-Notiz); v3.3.7 bietet Prometheus-Metriken/Grafana-Dashboards, die direkt in die razzfazz.ai-Observability-Schiene (OpenLIT/ClickHouse) passen, sowie reCAPTCHA-Hardening für selbstgehostete Login-Endpoints.
Parallel zu v3.3.7 hat Onyx am 20. Mai 2026 ein erstes Pre-Release v4.0.0-beta.0 publiziert (auf GitHub als Pre-release gekennzeichnet). Kernstück ist eine neue LLMFlow-Registry, die jeden LLM-Call-Site zentral kapselt und Tracing/Observability vereinheitlicht. Außerdem führt der Beta-Zweig ein gezieltes Reindexing-Schema für Dokumente ein, modernisiert die Index-Settings-Page und bringt ContentEditable-Inputs mit Rich-Formatting, Slack Enterprise Grid Support, Confluence Data Center Kompatibilität, OpenSearch Bulk-Update-Operationen und Multi-Arch-CLI-Binaries. v4.0.0 markiert das endgültige Aus für Vespa: jede Onyx-Deployment muss zwingend zuerst eine v3.x-Version durchlaufen, sonst gehen alle indexierten Daten verloren. Zusätzlich landen Business-Tier-Funktionen (License-Expiry-Grace-Period 14 Tage, Custom-Branding) und neue Embeddings wie Cohere embed-v4.0 und Gemini embedding-2.
Hoch — Breaking-Change-Vorwarnung: razzfazz.ai-Stack-Aufnahme von Onyx muss zwingend über v3.x laufen, bevor v4.x möglich ist (Vespa-Removal). Die neue LLMFlow-Registry vereinfacht zudem das Tracing-Setup mit OpenLIT/ClickHouse-Spans für interne Onyx-Calls.
Im April 2026 hat Onyx eine empirische Studie veröffentlicht, die Hybrid-Search (Dense+BM25) gegen klassische File-Search auf synthetischen Enterprise-Korpora mit 160.000 bzw. 510.000 Dokumenten vergleicht. Testaufbau: Cohere embed-english-v3.0 als Embeddings, GPT-5.4 als LLM. Ergebnis: Bei engen Single-Document-Fragen liefert Hybrid-Search 92% Document-Recall vs. 85% File-Search und ist mit 21s zu 87s rund 4× schneller; bei komplexen Multi-Document-Fragen zieht File-Search jedoch davon (76% vs. 57% Recall). Hybrid-Search ist durchgängig deutlich token-effizienter. Fazit der Autoren: optimale Knowledge-Acquisition kombiniert beide Modi — Hybrid für schnelle Targeted-Retrieval, File-Search für tiefere Exploration.
Mittel — Direkt anwendbar auf razzfazz.ai-Designentscheidungen für LightRAG/Dify-RAG-Pipelines: validiert hybrid-search als Default und liefert Schwellwerte, ab denen File-Search-Tooling lohnt.
In der letzten Februar-Woche 2026 hat Onyx das bisher grösste Release v3.0.0 als Stable ausgeliefert. Es bringt die vollständige Migration des Vector-Stores von Vespa zu OpenSearch (FOSS-Fork von ElasticSearch) inklusive Side-by-Side-Lauf in docker-compose und Helm-Chart sowie einem neuen Migration-Tab im Admin-Panel. SCIM 2.0 erlaubt jetzt Okta und Entra ID das automatische Provisioning von Users/Groups (Enterprise). Such- und Chat-Oberflaeche wurden zu einem einheitlichen UI verschmolzen, Code-Interpreter ist Default. Neu eingeführt wurden Onyx Lite (Chat-only-Modus, unter 1 GB RAM) und die Onyx CLI für lokale Deployments. Die Document-Search-APIs wurden von der Enterprise- in die Community-Edition überführt. Vespa wird in v4.0.0 final entfernt — jede Deployment muss zwingend v3.x durchlaufen.
Hoch — OpenSearch-Migration entkoppelt Onyx von der schwergewichtigen Vespa-Abhängigkeit (8.687.75 im Stack-Hinweis) und reduziert Memory-Footprint deutlich; SCIM 2.0 integriert sich sauber mit dem bestehenden Authentik-2026.2.3 als IdP. Onyx Lite eignet sich als Low-Resource-Variante für Edge/Test-Setups.
Am 19. Februar 2026 hat Onyx auf seinem Blog einen eigenen Benchmark veröffentlicht: 99 reale Workplace-Fragen über einem Korpus von rund 220.000 internen Dokumenten plus Webdaten, blind bewertet von zwei unabhängigen LLM-Judges. Resultat: Onyx schlägt in der Studie ChatGPT Enterprise, Claude Enterprise und Notion AI. Onyx hat die Benchmark-Fragen, LLM-as-Judge-Prompts und Scores im Repo onyx-dot-app/internal-rag-benchmark offengelegt, um Reproduzierbarkeit herzustellen. Methodisch wird argumentiert, dass moderne agentic RAG-Systeme die Beantwortung in Sub-Queries, Tool-Calls und Refinement-Loops zerlegen müssen — und dass klassische Single-Shot-Retrieval-Benchmarks die reale Leistung nicht abbilden. Die Veröffentlichung folgt direkt auf Onyx' Spitzenplatz im Deep-Research-Bench-Leaderboard.
Mittel — Liefert verwertbare Argumente in der Tool-Auswahl (Onyx vs. Dify vs. OpenWebUI im aktuellen Stack). Internes RAG-Benchmark-Repo ist als Vorlage für eigene razzfazz.ai-Evals nutzbar.
Yuhong Sun (Onyx-Co-Founder) hat am 17. Februar 2026 im Onyx-Blog detailliert, wie Onyx das Web-Search-Verhalten führender Agenten reverse-engineered und denselben Two-Tool-Workflow nun nativ integriert hat. Im Admin-Panel lässt sich pro Deployment zwischen Google PSE, Serper, Brave, Exa und Firecrawl wählen, ergänzt durch einen eingebauten Onyx-Scraper für Full-Text-Retrieval. Ziel sind schnelle, halluzinationsarme Antworten auf Live-Daten; neue Web-Search-APIs für eigene Agent-Builds wurden parallel ausgerollt. Der Post ist Teil einer Engineering-Serie, die Onyx' Spitzenplatz im Deep-Research-Bench-Leaderboard begleitet.
Mittel — razzfazz.ai betreibt bereits SearXNG und Crawl4AI im Stack; Onyx' Multi-Provider-Web-Search (inkl. Firecrawl-Integration) ist eine direkte Architektur-Referenz für die Bündelung dieser Services unter einem AI-Assistant-Frontend.