Datenbank-Spektrum: Fachartikel über die Wiederberechenbarkeit von Datenprodukten

Für datengetriebene Organisationen besteht eine zentrale Herausforderung darin, neue Daten in bestehende Charts, Berichte oder Empfehlungen einfließen zu lassen. Doch häufig enthalten diese Datenprodukte auch die manuelle Arbeit von Fachexperten. Ein effizientes Verfahren zur Wiederberechenbarkeit müsste diese menschlichen Interaktionen automatisch ergänzen und darüber hinaus mit Abhängigkeiten an externe Systeme umgehen können. Im Rahmen eines Kundenprojekts entwickelte mgm eine Big Data Architektur, die genau darauf ausgelegt ist. Sie ermöglicht es,  ältere Versionen von Datenprodukten zu rekonstruieren und mit neueren zu vergleichen.

Die technische Grundlage dieser Systemarchitektur präsentieren Matthias Kricke, Martin Grimmer und Michael Schmeißer in dem Paper Preserving Recomputability of Results from Big Data Transformation Workflows, das Mitte September im Datenbank-Spektrum erschienen ist. Das hier vollständig abrufbare Paper beschreibt zunächst den Aufbau der Architektur und geht anschließend auf die Erfahrungen der Implementierung des Systems ein.