Het grote aantal systemen, datatransformaties en uitgebreide data- en systeemlegacy maken het voor financiële instellingen een uitdaging om toezichthouders de vereiste mate van transparantie te bieden over hun data-integratie- en aggregatieprocessen die worden gebruikt voor rapportage. Data Lineage geeft inzicht in welke bedrijfs- en technische transformatielogica is toegepast op uw data en door wie.
In ons vorige artikel gingen we dieper in op de definitie en het gebruik van metadata en het toenemende belang ervan in de snel veranderende regelgeving.
Over het algemeen is metadata de voorwaarde voor een goede data lineage, die door de International Association of Data Management Professionals (DAMA, 2017) wordt gedefinieerd als "het pad waarlangs gegevens zich verplaatsen van het punt van oorsprong naar het punt van gebruik".1 Het beschrijft ook wat er gebeurt met gegevens terwijl deze door de organisatie stromen.
Figuur 1 toont een typische datagestuurde rapportageomgeving waarin brongegevens zo worden getransformeerd dat ze worden geaccepteerd door het datamodel, dat op zijn beurt wordt ingezet door de rapportagevereisten te vertalen naar een semantische laag. Bij het streven naar een datagestuurd rapportageproces worden drie soorten data lineage in overweging genomen:
Data Lineage heeft veel toepassingen die belangrijk zijn om het volledige potentieel van datagedreven rapportageprocessen te benutten:
Transparantie en visualisatie van uw datastromen stellen rapportagespecialisten, bedrijfsanalisten en dataspecialisten in staat om samen te werken en elkaar te begrijpen. Het maakt een efficiënte "zoektocht naar gegevens" in uw organisatie mogelijk, wat resulteert in kostenbesparingen en een kortere doorlooptijd van het oplossen van fouten en wijzigingsverzoeken.
Wanneer data lineage correct wordt geïmplementeerd en gebruikt, kan het de controle over uw datatransformatie- en rapportageprocessen verbeteren. Dit zal op zijn beurt resulteren in een betere kwaliteit van uw gegevens en rapportages en de discussie met de toezichthoudende instanties vergemakkelijken.
Een voorwaarde voor data lineage is een data governance framework dat een goed gedefinieerde metadatastrategie en eigenaarschap van metadata binnen uw organisatie omvat. Daarbij moet de focus liggen op het beschikbaar, accuraat en volledig zijn van metadata. Een volgende stap is het identificeren en verbinden van al uw data en de metadata ervan, van bron tot transformatielaag tot rapportageoplossing.
Metadata-identificatie- en beheerprocessen staan momenteel bekend als arbeidsintensief, inefficiënt en duur. Robotica en kunstmatige intelligentie (AI) kunnen een belangrijke rol spelen bij het taggen van metadata en het genereren van metadata. Terwijl handmatige metadata-tagging een duur proces kan zijn. Het kan (gemiddeld) € 2 - € 5 per metadata-item kosten.2 Aan de andere kant kan AI deze hoeveelheid 10x verminderen en tegelijkertijd de algehele kwaliteit van uw metadata en dus de herkomst van uw gegevens verbeteren.
Daarom zal automatisering van real-time identificatie en verbinding van metadata, evenals de visualisatie van de herkomst van gegevens, veel data-intensieve rapportageprocessen in uw organisatie verbeteren, terwijl ook de kosten die ermee gepaard gaan aanzienlijk worden verlaagd.
Dit zal op zijn beurt de hoeksteen leggen voor uw organisatie om uiteindelijk toekomstbestendig en een echt datagedreven organisatie te worden. In ons volgende artikel gaan we dieper in op de toepassing van deze automatiseringstechnieken in de wereld van metadata management, data lineage en hoe dit jouw organisatie kan helpen bij het verbeteren van de rapportageprocessen.
1 DAMA International, Data Management Body Of Knowledge, page 28, 2nd edition, 2017
2 EDIA (2018), Why is automated metadata-tagging better than manual tagging?
Wilt u meer weten over Metadata Management of Data Lineage? Neem dan contact op met Yuri Jolly via onderstaande gegevens.