In diesem Blogbeitrag haben wir uns damit beschäftigt, wie Datenanonymisierung im Data Warehouse (DWH) angewendet werden kann und welche Vorteile damit einher gehen. Ausgangspunkt für die Überlegung war, dass personenbezogene Daten im Zuge der Datenschutz-Grundverordnung (DSGVO) mit Ablauf bestimmter Löschfristen oder bei Beantragung einer Löschung endgültig gelöscht werden müssen. Dabei haben wir gesehen, dass die Datenanonymisierung im DWH in mehreren Anwendungsfällen einen Mehrwert liefert, der bei einer simplen Löschung verwehrt bliebe. Wie bereits am Ende des Blogbeitrags zur Datenanonymisierung im DWH angedeutet, haben wir uns bei movisco mit dem Thema Datenanonymisierung in SAP BW/4HANA weiter auseinandergesetzt und eine umfassende Lösung erarbeitet.
Dieser Blogbeitrag wird anhand eines Szenarios einen ersten Einblick in unsere Lösung zur Datenanonymisierung in SAP BW/4HANA geben und zudem aufzeigen, welche technischen Überlegungen unser Vorgehen beeinflusst haben.
Das im Folgenden vorgestellte Tool “anovisco” stellt die Grundlage für unser movisco-Dienstleistungsangebot zur Datenanonymisierung in SAP BW/4HANA dar. Mehr Infos zu unserem Dienstleistungsangebot inklusive kostenloser Demo und wie wir Sie beim Thema Datenanonymisierung in SAP BW/4HANA unterstützen, finden Sie am Ende unseres Blogbeitrags!
Im ersten Blogbeitrag haben wir DWH-Systeme im Allgemeinen betrachtet. Da in unseren Projekten der Fokus auf SAP BW/4HANA liegt, bedarf es zuerst einer Klärung, wie in SAP BW/4HANA Daten und somit auch die für uns interessanten personenbezogene Daten konkret gespeichert und im Datenfluss integriert werden können.
Im Zuge der Entwicklung von SAP BW on HANA und SAP BW/4HANA hat SAP die LSA++ DWH-Architektur eingeführt. Eine der Neuerungen gegenüber der alten LSA-Architektur, sind die Advanced DataStore-Objekte (ADSO), die als „Einheits-Persistenz“ dienen und somit die alten InfoProvider der Persistenz-Schichten (InfoCubes und klassische DataStore-Objekte) ersetzen und die jeweiligen Anwendungsfälle durch individuelle Profile abdecken. ADSOs finden daher auf vielen Schichten der LSA++ DWH-Architektur Anwendung, insbesondere im Corporate Memory, der Data-Propagation-Schicht und in der Schicht der Architected Data Marts. Daher liegt bei der Datenanonymisierung in SAP BW/4HANA ein großer Fokus auf der adäquaten Anonymisierung von ADSOs.
ADSOs können sowohl auf Grundlage von InfoObjekten als auch feldbasiert modelliert werden. Da personenbezogene Daten in ADSOs bei beiden Modellierungsansätzen als Merkmale in Erscheinung treten, muss für die Datenanonymisierung eine Lösung gewählt werden, die personenbezogene Merkmale in den ADSOs berücksichtigen kann, unabhängig davon, ob das Merkmal feldbasiert oder anhand eines InfoObjektes modelliert wird.
Hauptsächlich werden Transaktionsdaten in ADSOs gespeichert, die Speicherung von Stammdaten in ADSOs ist je nach Anwendungsfall dennoch möglich. Stammdaten werden in SAP BW/4HANA hingegen aber insbesondere in InfoObjekten persistiert. Als „stammdatentragende Merkmale“ modellierte InfoObjekte können somit Stammdaten in Form von Attributen und weiteren (optional sprachenabhängigen) Texten persistieren. Bei der Anonymisierung von Daten müssen entsprechend nicht nur ADSOs, sondern auch InfoObjekte als potenzieller Speicherort für personenbezogene Daten berücksichtigt werden.
Zusätzlich sollte überlegt werden, wie sichergestellt werden kann, dass alle relevanten Datensätze anonymisiert werden, nicht jedoch zusätzliche Daten fälschlicherweise von der Anonymisierung betroffen sind oder versehentlich nicht alle relevanten Daten anonymisiert werden. Dazu ist ein Verständnis über die Datenmodellierung und die technischen Merkmale des BW/4HANA notwendig, um auf Grundlage bestimmter (Schlüssel-)Merkmale die Anonymisierung der jeweiligen Datensätze in den ADSOs und InfoObjekten durchführen zu können.
Abschließend möchten wir alle Anonymisierungs-Prozesse dokumentieren, um eine Übersicht über die getätigten Maßnahmen zu erhalten. SAP BW/4HANA stellt keine vordefinierte Lösung zur Verfügung, um ein derartiges Protokoll zu generieren. Um eine manuelle, händische Protokollierung zu vermeiden, muss dies entsprechend in einer Eigenentwicklung implementiert werden.
Die geschilderten Faktoren in SAP BW/4HANA waren maßgeblich für die Erfassung der Anforderungen unserer Datenanonymisierungs-Lösung, um sicherzustellen, dass die Lösung umfassend und flexibel ist und einen hohen Grad an Automatisierung aufweist. Darüber hinaus möchten wir sicherstellen, dass die Anonymisierung nachvollziehbar ist und somit auch bei der Durchführung dokumentiert wird.
Anhand eines einfachen Szenarios demonstrieren wir nun, wie anovisco zur Datenanonymisierung in SAP BW/4HANA personenbezogene Daten anonymisiert, so dass die Daten entsprechend der im ersten Blogbeitrag diskutierten Anwendungsfälle weiterverarbeitet werden können.
In unserem Szenario betrachten wir ein einziges ADSO, das Beziehungen zwischen zwei Geschäftspartnern unseres Unternehmens erfasst. Merkmale (InfoObjekte) sind dabei unter anderem die Namen und Funktionen der beteiligten Geschäftspartner, die Art der Beziehung und deren eindeutige Identifikationsnummer, die Adresse, an der die Beziehung hauptsächlich stattfindet, die Dauer der Beziehung und abschließend noch zusätzliche Informationen über die Beziehung, etwa die Größenordnung und Risikoklassifizierung gemäß interner Skalen.
Unsere Daten sehen wie folgt aus: [VORHER]
Im Rahmen der Analytics-Strategie unseres Unternehmens möchten wir analysieren, welche Merkmale das Risiko einer Geschäftspartner-Beziehung beeinflussen, so dass in Zukunft Entscheidungen auf Grundlage dieser Einblicke getroffen werden können.
Die Herausforderung: Wenn Geschäftspartner ausscheiden, müssen die zugehörigen Beziehungen aus unseren Daten gelöscht werden, um der DSGVO zu genügen, da personenbezogene Daten, wie etwa der Name und eine relevante Adresse gespeichert werden.
Tipp: In der „echten“ Welt muss die Löschung und Anonymisierung im Einklang mit dem unternehmensweiten Löschkonzept stehen, das wiederum selbstverständlich DSGVO-konform sein muss. Zur Vereinfachung sieht das Unternehmen in unserem Szenario vor, dass ergänzende Stammdaten, wie hier die Namen und die Adressen im Geschäftspartner-Beziehungen-ADSO, spätestens 6 Monate nach Ausscheiden eines Geschäftspartners zu löschen sind, wenn kein Folgeauftrag vorliegt.
In unserem Beispiel scheidet der Geschäftspartner mit GP-ID 54823 aus.
Bevor wir die Anonymisierung durchführen können, müssen wir uns entscheiden, wie die entsprechenden Merkmale nach der Anonymisierung aussehen sollen. In diesem Fall genügt es uns, wenn der Name durch „XXXX“, die Postleitzahl durch „99999“ und das Datum durch den 01. Januar des ursprünglichen Jahres ausgetauscht wird. Komplexere Anonymisierungs-Methoden sind jedoch auch denkbar.
Um die Anonymisierung durchzuführen, wird zuerst die zu anonymisierende Geschäftspartner-ID im Tool erfasst. Jetzt kann mithilfe eines Programms die Anonymisierung des Geschäftspartner-ADSO automatisiert erfolgen. Dabei werden nur exakt die Daten verarbeitet und anonymisiert, die zur hinterlegten Geschäftspartner-ID passen. Die ursprünglichen Daten wurden somit durch die anonymisierten Daten ersetzt.
Wie wir sehen können, hat die Anonymisierung funktioniert: [NACHHER]
Wir können also weiterhin die Datensätze analysieren, die personenbezogenen Merkmale sind jetzt jedoch anonymisiert.
Zusätzlich wird eine Text-Datei ausgegeben, die wichtige Informationen zum durchgeführten Anonymisierungs-Prozess, wie etwa unter anderem das Datum und der Zeitpunkt der Anonymisierung, das betroffene ADSO und die anonymisierten IDs protokolliert.
Wir haben in diesem Blogbeitrag betrachtet, was in SAP BW/4HANA technisch zu beachten ist, wenn die Anonymisierung personenbezogener Daten gewünscht ist. Das vorgestellte Beispiel veranschaulicht, wie unser movisco Datenanonymisierungs-Tool anovisco personenbezogene Daten in SAP BW/4HANA DSGVO-konform anonymisiert und die – anderenfalls gelöschten Daten – für historische Analysen verfügbar macht.
Haben wir Ihr Interesse an einer Datenanonymisierungs-Lösung in SAP BW/4HANA geweckt? Auf unserer Webseite entsteht zurzeit ein neuer Bereich zu unserem Datenanonymisierungs-Tool als Dienstleistungsangebot. Dort bieten wir Datenanonymisierung in SAP BW/4HANA als umfassende Dienstleistung, beginnend von der Analyse des Systems bis zur Implementierung und Instandhaltung, an. Unsicher, welche Objekte in Ihrem System betroffen sind? Wir helfen Ihnen dabei, Ihr System zu überprüfen und für die Einführung von anovisco vorzubereiten!
Gerne demonstrieren wir Ihnen außerdem kostenlos die im Rahmen dieses Blogbeitrags präsentierte Lösung genauer und klären Sie weiter über Datenanonymisierung in SAP BW/4HANA auf.
Haben Sie jetzt schon Fragen oder Interesse? Zögern Sie nicht, uns zu kontaktieren:
Wir freuen uns über Ihre direkte Kontaktaufnahme!