Expertenvortrag: Reproduzierbarkeit von Ergebnissen in Big Data-Systemen

Big Data in Business hieß das Motto eines Workshops des Competence Center for Scalable Data Services and Solutions (ScaDS) am 13. November. Michael Schmeißer von mgm war als Referent vor Ort und thematisierte Herausforderungen und Lösungsansätze rund um reproduzierbare Ergebnisse in Big Data Szenarien.

Produkte aus BigData-Systemen haben oft eine Vielzahl von Eingabedatenquellen. Durch einen permanenten Zustrom von Daten zum System und die Lagerung in unterschiedlichen Technologien, lässt sich ein globaler Zustand der Eingabedatenmenge oft schwer beschreiben. Besteht allerdings die Forderung, ausgelieferte Datenprodukte erneut exakt gleich oder mit geringen Abwandlungen herstellen zu können, ist eine solche genaue Beschreibung der Eingabedatenmenge nötig. Der Vortrag beschrieb, wie dies durch Anwendung vollständiger Historisierung, garantierte Zeitschranken für Konsistenz innerhalb eines Speichersystems und einer allgemeinen Anwendung von Bitemporalität erreicht werden kann.

Share