← Mein Newsfeed newsfeed.avintaris.com
⚙️ Stack — AI & Data

🔺 Docling

Docling ist IBMs Open-Source Toolkit zur Konvertierung von Dokumenten (PDF/DOCX/HTML) in LLM-freundliche Repräsentation. razzfazz.ai Stack läuft docling-serve-cpu v1.18.0. Seit Deployment zwei Minor-Releases: **v1.19.0 (20.05.2026)** mit serverseitigem Page-Slicing für lange PDFs, und **v1.20.0 (21.05.2026)** mit erweiterten Metadaten-Callbacks. Sicherheitsrelevant: CVE-2026-24009 (RCE via unsafe PyYAML deserialization in docling-core) gefixt in docling-core 2.48.4 — Box-Image bündelt deutlich neueres docling-core 2.77.0, also NICHT betroffen.

Wandelt komplexe Dokumente in DocTags/Markdown/JSON für RAG- und Fine-Tuning-Pipelines. Anfang 2026 spendete IBM das Projekt an Linux Foundation Agentic AI Foundation. docling-serve ist die FastAPI-Variante (CPU-Service im Stack).

2 News · Letzte: 2026-05-21 📡 RSS
News-Verlauf

docling-serve v1.20.0 — erweiterte Metadaten in Callbacks

Minor-Release einen Tag nach v1.19.0. Hauptfeature: 'Expose docs metadata in callbacks' (#612) — Webhook-/Callback-Konsumenten bekommen jetzt vollständige Dokument-Metadaten (Titel, Autoren, Seitenzahl, Quelle) zusammen mit Konvertierungsergebnis. Relevant für asynchrone Pipelines mit parallelen Dokumenten. Bundle: docling 2.95.0, docling-core 2.77.0, docling-ibm-models 3.13.2, docling-jobkit 1.20.0, docling-mcp 2.0.1, docling-parse 5.11.0, docling-slim 2.95.0. Latest, kein Pre-Release.
Direkter Upgrade-Kandidat für razzfazz.ai Box (compatibility: patch). Bessere Callback-API für asynchrone Onyx/LightRAG-Pipelines. Risikoarm, nur additive Features.

docling-serve v1.19.0 — serverseitiges Page-Slicing für lange PDFs + API-Härtung

Erstes Release nach deployten v1.18.0. (1) Control error detail of public API responses (#609) — Admins können Fehler-Detail-Auslieferung steuern (Production-Härtung gegen Information-Disclosure). (2) Server side page slicing und concurrency für lange PDFs (#585) — Server zerlegt lange PDFs automatisch in Page-Chunks und verarbeitet parallel, verbessert Throughput und Memory-Footprint. GitHub Private Vulnerability Reporting aktiviert (#601).
Direkter Mehrwert für die Box — page-slicing senkt Memory-Druck bei großen PDFs (typische Buddy-Use-Cases). API-Härtung relevant wenn docling-serve hinter Authentik in Multi-Tenant exponiert.
← zurück zum Dashboard