Whitepaper: Data Lake

Whitepaper: Wie baue ich einen Data Lake für die Kommunikationsabteilung auf?
Datenmanagement

Wie baue ich einen Data Lake für die Kommunikationsabteilung auf?

Datensilos überwinden, Abhängigkeiten abbauen, datengetrieben entscheiden

📅 Februar 2023
📄 AG CommTech – Cluster Wirkungsmessung

Jetzt kostenlos herunterladen

Die wichtigsten Erkenntnisse

Die meisten Kommunikationsabteilungen lassen ihre Daten bei Dienstleistern – und verlieren sie beim Anbieterwechsel. Ein Data Lake schafft Unabhängigkeit.

Erst wer Daten aus Owned, Earned und Paid Media zentral zusammenführt, kann Wirkungsketten vollständig auswerten.

Der Aufbau eines Data Lakes folgt 5 klaren Schritten – von der Data Strategy bis zur produktiven Nutzung mit Dashboards.

Ziel ist nicht technisches Expertenwissen, sondern die Fähigkeit, ein Data-Lake-Projektteam erfolgreich zu orchestrieren.

Warum dieses Whitepaper?

Der Aufbau eines Data Lakes ist ein technisches Thema – und damit auf den ersten Blick kein Thema für Kommunikatorinnen und Kommunikatoren. Aber: Wer weiß, was ein Data Lake ist, welche Möglichkeiten er eröffnet und wie er durch die IT aufgebaut wird, kann innerhalb des Unternehmens als kompetenter Ansprechpartner auftreten und das Projektteam gezielt steuern.

Dieses Whitepaper vermittelt kein technisches Tiefenwissen, sondern versetzt Kommunikationsprofis in die Lage, ein Data-Lake-Projekt zu orchestrieren.


Warum einen Data Lake?

Daten sind das neue Gold – aber sie liegen selten im eigenen Datenspeicher

Drei zentrale Gründe sprechen für einen eigenen Data Lake in der Kommunikation: Datenhoheit – wer seine Analysen bei Dienstleistern belässt, verliert beim Anbieterwechsel wertvolle historische Daten. Unabhängigkeit – der Zugriff auf eigene Daten darf nicht davon abhängen, was externe Anbieter erlauben. Vernetzung – nur wer Daten aus Facebook, Google Analytics, WordPress, Newsletter-Tools und Medienanalyse zentral zusammenführt, kann Zusammenhänge im Gesamtbild erkennen und die wahren Optimierungsansätze identifizieren.

Ein Data Lake ist eine zentrale, skalierbare und flexible Datenplattform, die strukturierte und unstrukturierte Daten aus verschiedenen Quellen speichert – ohne vordefiniertes Schema und mit der Kapazität für Big-Data-Analysen.


Die 4 Evolutionsstufen

Von den Abhängigen zu den Autarken

Das Whitepaper beschreibt vier Reifestufen in der Datenhaltung von Kommunikationsabteilungen: Die Abhängigen haben alle Daten bei Dienstleistern und können sie nicht zusammenführen. Die Vorsorgenden beginnen, Earned-Daten einzusammeln und schaffen einen wachsenden Datenschatz. Die Unabhängigen lassen sich auf eigener Datenbasis ein Dashboard durch einen Dienstleister erstellen. Die Autarken leben den Self-Service-Gedanken vollständig: eigene Expertinnen bereiten Daten aus dem Data Lake auf, konfigurieren Dashboards und fertigen Sonderanalysen an – alles auf dem eigenen Datenbestand.


5 Schritte zum Data Lake

Von der Strategie bis zur produktiven Nutzung

Schritt 1 – Data Strategy: Fachliche Anwendungsfälle definieren, bevor technische Entscheidungen getroffen werden. Welche Daten brauche ich für welche Analysen? Für die technische Infrastruktur eignen sich Cloud-Lösungen wie Amazon AWS, Microsoft Azure oder Google Cloud.

Schritt 2 – Daten sammeln: So viele Rohdaten wie möglich abspeichern – auch ohne heutigen Anwendungsfall. Dateninseln öffnen, Transparenz schaffen und Data Swamps durch saubere Metadaten und Governance-Strukturen vermeiden. Pilotprojekte (z.B. Sentiment-Analysen) helfen, den Nutzen intern zu vermitteln.

Schritt 3 – Datenablage in Zonen: Ein Data Lake ist in Zonen unterteilt – Stage (Rohdaten ablegen), Transformation (bereinigen, strukturieren), Processing (Geschäftslogik anwenden) und Insights (Schnittstellen für Dashboards). Eine Operations-Ebene sichert Datenmanagement und Governance über alle Zonen.

Schritt 4 – Datenkatalog & Zugriffe: Moderne Cloud-Lösungen generieren automatisch Datenkataloge. Zugriffsrichtlinien schützen sensible Daten – entweder über einen Top-Down-Ansatz (Daten im Lake anonymisieren) oder einen Self-Service-Ansatz (Metadatenkatalog mit bedarfsgerechter Bereitstellung).

Schritt 5 – Produktive Nutzung: Daten aufbereiten und in Dashboards visualisieren. Gängige Tools wie Microsoft Power BI, Qlik Sense oder Tableau lassen sich problemlos an Cloud-Data-Lake-Lösungen anbinden.


Ausblick

Vom Data Lake zum Data Lakehouse

Neuere Ansätze verbinden die Flexibilität eines Data Lakes mit der Struktur eines Data Warehouses: das Data Lakehouse (ab 2020). Es vereint Big-Data-Verarbeitung mit strukturierter Datenorganisation, besserer Governance und niedrigeren Betriebskosten – und dürfte für viele Kommunikationsabteilungen die zukunftsfähigste Lösung sein.

Nach dem Data Lake folgen zwei weitere Schritte: Daten auf eine gemeinsame Logik bringen und ein Dashboard mit aussagekräftigen Kennzahlen aufbauen. Dazu empfiehlt das Whitepaper das ergänzende AG-CommTech-Whitepaper „Decision Support Center”.

Was dieses Whitepaper leistet

Datenhoheit

Kommunikationsabteilungen verstehen, wie sie ihre Daten dauerhaft in eigener Hand halten und Abhängigkeiten von Dienstleistern abbauen.

Orientierung

Ein klares Reifegradmodell und 5 konkrete Schritte zeigen den Weg vom Datensilo zum autarken Data Lake.

Projektkompetenz

Kommunikationsprofis werden in die Lage versetzt, ein Data-Lake-Projekt mit der IT zu initiieren und erfolgreich zu steuern.

Autoren & wissenschaftliche Begleitung
+
Jörg Forthmann
IMWF
Andreas Rossbach
Acronis
Lea Waskowiak
Telefonica
Prof. Dr. Lothar Rolke
em., Hochschule Mainz
Philipp Dethloff
KION Group
Christian Krause
Allgeier Cyris
Dr. Stefan Krause
TIQ Solutions
Frank Sielaff
Entrusted

Whitepaper jetzt kostenlos herunterladen

Füllen Sie das Formular aus und erhalten Sie das vollständige Whitepaper „Wie baue ich einen Data Lake für die Kommunikationsabteilung auf?” als PDF.