← Mein Newsfeed newsfeed.avintaris.com
⚙️ Stack — AI & Data

🔺 Onyx

Onyx (vormals Danswer) hat im Filterzeitraum eine Reihe bedeutender Releases ausgeliefert: v3.0.0 als bislang grösster Release brachte die Vespa-zu-OpenSearch-Migration, SCIM 2.0 für Enterprise (Okta/Entra ID), eine vereinheitlichte Such- und Chat-Oberflaeche, Code Interpreter standardmaessig, sowie das neue Onyx Lite und die Onyx CLI. Document Search APIs wurden von der Enterprise Edition in die Community Edition uebernommen. Im Mai 2026 folgten v3.3.7 (Slack-Bot-Agent-Selectoren, Prometheus-Metriken, Character-Level-Streaming) und das Pre-Release v4.0.0-beta.0 mit neuer LLMFlow-Registry und verbessertem Multi-Thread-Image-Processing. Onyx fuehrte Deep Research im Februar 2026 das Leaderboard an.

6 News · Letzte: 2026-05-20 📡 RSS
News-Verlauf

Onyx v3.3.7 stable: Slack-Bot Agent-Selector, Prometheus-Metriken, Character-Streaming

Onyx hat am 20. Mai 2026 v3.3.7 als stabiles Release veröffentlicht — laut Release Notes mit 415 Commits seit v3.2.14 und Beiträgen von 19 Contributors. Zentrale Neuerungen sind ein durchsuchbarer Agent-Selector im Slack-Bot, smooth character-level streaming im Chat, scrollable Tables mit Overflow-Fade und ein neuer reCAPTCHA-Schutz für das /auth/login-Endpoint (Enterprise Assessment API). Auf der Indexing-Seite kamen tabellarische Section-Unterstützung, ein CSV-Chunker mit Field-Value-Implementation und Image-Extraction aus PDFs hinzu. Betrieblich wurden Prometheus-Metriken ausgebaut, Grafana-Dashboards für OpenSearch und Redis-Queues sowie zusätzliche ServiceMonitors im Helm-Chart geliefert. Connector-Seitig wurde Gong auf checkpointed Indexing migriert, Google Drive Pruning optimiert sowie Confluence-, SharePoint- und Slack-Connectoren stabilisiert. Admin-Features: globaler Multi-Model-Chat-Toggle, Admin-API für failed documents und ein Query-History-Toggle.
Hoch — Onyx steht laut Stack-Hinweisen als potenzielle Enterprise-Search-/AI-Assistant-Komponente in der Pipeline (onyx-backend/web/model-server v3.2.12 in der Stack-Notiz); v3.3.7 bietet Prometheus-Metriken/Grafana-Dashboards, die direkt in die razzfazz.ai-Observability-Schiene (OpenLIT/ClickHouse) passen, sowie reCAPTCHA-Hardening für selbstgehostete Login-Endpoints.

Onyx v4.0.0-beta.0 Pre-Release: LLMFlow-Registry und Vespa-Endspiel

Parallel zu v3.3.7 hat Onyx am 20. Mai 2026 ein erstes Pre-Release v4.0.0-beta.0 publiziert (auf GitHub als Pre-release gekennzeichnet). Kernstück ist eine neue LLMFlow-Registry, die jeden LLM-Call-Site zentral kapselt und Tracing/Observability vereinheitlicht. Außerdem führt der Beta-Zweig ein gezieltes Reindexing-Schema für Dokumente ein, modernisiert die Index-Settings-Page und bringt ContentEditable-Inputs mit Rich-Formatting, Slack Enterprise Grid Support, Confluence Data Center Kompatibilität, OpenSearch Bulk-Update-Operationen und Multi-Arch-CLI-Binaries. v4.0.0 markiert das endgültige Aus für Vespa: jede Onyx-Deployment muss zwingend zuerst eine v3.x-Version durchlaufen, sonst gehen alle indexierten Daten verloren. Zusätzlich landen Business-Tier-Funktionen (License-Expiry-Grace-Period 14 Tage, Custom-Branding) und neue Embeddings wie Cohere embed-v4.0 und Gemini embedding-2.
Hoch — Breaking-Change-Vorwarnung: razzfazz.ai-Stack-Aufnahme von Onyx muss zwingend über v3.x laufen, bevor v4.x möglich ist (Vespa-Removal). Die neue LLMFlow-Registry vereinfacht zudem das Tracing-Setup mit OpenLIT/ClickHouse-Spans für interne Onyx-Calls.

Onyx Studie: File-Search vs. Hybrid-Search auf 160k-510k Enterprise-Dokumenten

Im April 2026 hat Onyx eine empirische Studie veröffentlicht, die Hybrid-Search (Dense+BM25) gegen klassische File-Search auf synthetischen Enterprise-Korpora mit 160.000 bzw. 510.000 Dokumenten vergleicht. Testaufbau: Cohere embed-english-v3.0 als Embeddings, GPT-5.4 als LLM. Ergebnis: Bei engen Single-Document-Fragen liefert Hybrid-Search 92% Document-Recall vs. 85% File-Search und ist mit 21s zu 87s rund 4× schneller; bei komplexen Multi-Document-Fragen zieht File-Search jedoch davon (76% vs. 57% Recall). Hybrid-Search ist durchgängig deutlich token-effizienter. Fazit der Autoren: optimale Knowledge-Acquisition kombiniert beide Modi — Hybrid für schnelle Targeted-Retrieval, File-Search für tiefere Exploration.
Mittel — Direkt anwendbar auf razzfazz.ai-Designentscheidungen für LightRAG/Dify-RAG-Pipelines: validiert hybrid-search als Default und liefert Schwellwerte, ab denen File-Search-Tooling lohnt.

Onyx v3.0.0 Stable: Vespa-zu-OpenSearch-Migration, SCIM 2.0, Onyx Lite und CLI

In der letzten Februar-Woche 2026 hat Onyx das bisher grösste Release v3.0.0 als Stable ausgeliefert. Es bringt die vollständige Migration des Vector-Stores von Vespa zu OpenSearch (FOSS-Fork von ElasticSearch) inklusive Side-by-Side-Lauf in docker-compose und Helm-Chart sowie einem neuen Migration-Tab im Admin-Panel. SCIM 2.0 erlaubt jetzt Okta und Entra ID das automatische Provisioning von Users/Groups (Enterprise). Such- und Chat-Oberflaeche wurden zu einem einheitlichen UI verschmolzen, Code-Interpreter ist Default. Neu eingeführt wurden Onyx Lite (Chat-only-Modus, unter 1 GB RAM) und die Onyx CLI für lokale Deployments. Die Document-Search-APIs wurden von der Enterprise- in die Community-Edition überführt. Vespa wird in v4.0.0 final entfernt — jede Deployment muss zwingend v3.x durchlaufen.
Hoch — OpenSearch-Migration entkoppelt Onyx von der schwergewichtigen Vespa-Abhängigkeit (8.687.75 im Stack-Hinweis) und reduziert Memory-Footprint deutlich; SCIM 2.0 integriert sich sauber mit dem bestehenden Authentik-2026.2.3 als IdP. Onyx Lite eignet sich als Low-Resource-Variante für Edge/Test-Setups.

Onyx schlägt ChatGPT Enterprise, Claude Enterprise und Notion AI im Agentic-RAG-Benchmark

Am 19. Februar 2026 hat Onyx auf seinem Blog einen eigenen Benchmark veröffentlicht: 99 reale Workplace-Fragen über einem Korpus von rund 220.000 internen Dokumenten plus Webdaten, blind bewertet von zwei unabhängigen LLM-Judges. Resultat: Onyx schlägt in der Studie ChatGPT Enterprise, Claude Enterprise und Notion AI. Onyx hat die Benchmark-Fragen, LLM-as-Judge-Prompts und Scores im Repo onyx-dot-app/internal-rag-benchmark offengelegt, um Reproduzierbarkeit herzustellen. Methodisch wird argumentiert, dass moderne agentic RAG-Systeme die Beantwortung in Sub-Queries, Tool-Calls und Refinement-Loops zerlegen müssen — und dass klassische Single-Shot-Retrieval-Benchmarks die reale Leistung nicht abbilden. Die Veröffentlichung folgt direkt auf Onyx' Spitzenplatz im Deep-Research-Bench-Leaderboard.
Mittel — Liefert verwertbare Argumente in der Tool-Auswahl (Onyx vs. Dify vs. OpenWebUI im aktuellen Stack). Internes RAG-Benchmark-Repo ist als Vorlage für eigene razzfazz.ai-Evals nutzbar.

Onyx baut Internet-Search nach OpenAI-Vorbild — Serper, Exa, Firecrawl, Brave

Yuhong Sun (Onyx-Co-Founder) hat am 17. Februar 2026 im Onyx-Blog detailliert, wie Onyx das Web-Search-Verhalten führender Agenten reverse-engineered und denselben Two-Tool-Workflow nun nativ integriert hat. Im Admin-Panel lässt sich pro Deployment zwischen Google PSE, Serper, Brave, Exa und Firecrawl wählen, ergänzt durch einen eingebauten Onyx-Scraper für Full-Text-Retrieval. Ziel sind schnelle, halluzinationsarme Antworten auf Live-Daten; neue Web-Search-APIs für eigene Agent-Builds wurden parallel ausgerollt. Der Post ist Teil einer Engineering-Serie, die Onyx' Spitzenplatz im Deep-Research-Bench-Leaderboard begleitet.
Mittel — razzfazz.ai betreibt bereits SearXNG und Crawl4AI im Stack; Onyx' Multi-Provider-Web-Search (inkl. Firecrawl-Integration) ist eine direkte Architektur-Referenz für die Bündelung dieser Services unter einem AI-Assistant-Frontend.
← zurück zum Dashboard