docling-serve v1.20.0 — erweiterte Metadaten in Callbacks
Direkter Upgrade-Kandidat für razzfazz.ai Box (compatibility: patch). Bessere Callback-API für asynchrone Onyx/LightRAG-Pipelines. Risikoarm, nur additive Features.
Docling ist IBMs Open-Source Toolkit zur Konvertierung von Dokumenten (PDF/DOCX/HTML) in LLM-freundliche Repräsentation. razzfazz.ai Stack läuft docling-serve-cpu v1.18.0. Seit Deployment zwei Minor-Releases: **v1.19.0 (20.05.2026)** mit serverseitigem Page-Slicing für lange PDFs, und **v1.20.0 (21.05.2026)** mit erweiterten Metadaten-Callbacks. Sicherheitsrelevant: CVE-2026-24009 (RCE via unsafe PyYAML deserialization in docling-core) gefixt in docling-core 2.48.4 — Box-Image bündelt deutlich neueres docling-core 2.77.0, also NICHT betroffen.
Wandelt komplexe Dokumente in DocTags/Markdown/JSON für RAG- und Fine-Tuning-Pipelines. Anfang 2026 spendete IBM das Projekt an Linux Foundation Agentic AI Foundation. docling-serve ist die FastAPI-Variante (CPU-Service im Stack).
Direkter Upgrade-Kandidat für razzfazz.ai Box (compatibility: patch). Bessere Callback-API für asynchrone Onyx/LightRAG-Pipelines. Risikoarm, nur additive Features.
Direkter Mehrwert für die Box — page-slicing senkt Memory-Druck bei großen PDFs (typische Buddy-Use-Cases). API-Härtung relevant wenn docling-serve hinter Authentik in Multi-Tenant exponiert.