W minionych latach zarządzanie danymi (Data Governance) przeszło prawdziwą rewolucję. Sposób patrzenia na dane i umiejętność wykorzystania ich do osiągania celów biznesowych zmieniały się wraz ze wzrostem świadomości o ich wadze w przedsiębiorstwie. Dziś efektywne podejmowanie decyzji strategicznych bez wykorzystywania wiedzy opartej na danych wydaje się wręcz niemożliwe.
Z roku na rok danych przybywa. Czasy, w których wszystkie zgromadzone informacje w przedsiębiorstwie były pozyskiwane jedynie z kilku źródeł i przechowywane w ustrukturyzowanej formie, bezpowrotnie minęły. Danych jest więcej, a tempo, w jakim przyrastają jest szybsze, niż kiedykolwiek przedtem, co doskonale prezentuje grafika poniżej:
Przyrost danych na platformach, średnio w czasie minuty w 2020 roku.
Wejście w życie technologii Big Data wydawało się być odpowiedzią na problem coraz większej ilości danych pochodzących z różnych źródeł, często przechowywanych w formie nieustrukturyzowanej. Jednak samo przechowywanie i przetwarzanie dużych zbiorów danych nie rozwiązało problemu uwidocznionego podczas ich analizy – niskiej jakości i braku zaufania do ich wiarygodności.
Dane bowiem stają się bezużyteczne, jeżeli nie niosą za sobą informacji. Data Governance swoje początki wzięło właśnie od Data Quality. Wymiary jakości danych, bez których właściwie nie możemy mówić o Data Governance, zostały określone na podstawie często obserwowanych problemów. Poniżej prezentujemy przykładowe wymiary jakości danych.
Wymiar jakości danych |
Pytanie |
Przykładowy błąd i potencjalne skutki |
---|---|---|
|
|
|
Kompletność |
Czy wszystkie potrzebne dane są dostępne? |
Dane o numerze telefonu nie są wymagane w systemie źródłowym, przez co nie zostały uzupełnione dla znacznej części klientów. Cel biznesowy, jakim jest dotarcie do 80% klientów poprzez kanał telefoniczny w kampanii CRM, nie może być spełnione |
Unikalność |
Czy dane są zduplikowane? |
Dane o kliencie są wprowadzane w kilku systemach źródłowych. W hurtowni danych jeden klient występuje pod trzema rekordami, co skutkuje nieprawidłowym obrazem rzeczywistości w raportach dotyczących stanu portfela klientów. |
Aktualność |
Czy dane są aktualne? |
Adres klienta się zmienił, ale nie zostało to odnotowane w systemie, w wyniku czego list wysłany do klienta w rzeczywistości do niego nie dotarł – dotarł za to do osoby zamieszkałej pod tym adresem. |
Poprawność |
Czy dane są przechowywane we właściwym formacie? |
System źródłowy dopuszcza znaki specjalne w polu „numer telefonu”, przez co pojawiają się niepoprawne wartości w tym polu. Konieczne jest czyszczenie danych przed ich wykorzystaniem w kampaniach marketingowych, co generuje dodatkowe koszty. |
Adekwatność |
Czy dane reprezentują rzeczywiste wartości? |
Adres wpisany w systemie źródłowym w rzeczywistości nie istnieje. List wysłany do klienta w rzeczywistości nigdzie nie dotarł. |
Spójność |
Czy dane są spójne pomiędzy systemami, w którym są przechowywane? |
Dane o kliencie są dostępne w dwóch systemach źródłowych. W jednym z nich imię klienta zostało wpisane poprawnie, w drugim – z literówką. Taki błąd skutecznie utrudnia proces deduplikacji danych, co z kolei obniża współczynnik unikalności rekordów. |
Data Governance to pojęcie dużo szersze, niż samo Data Quality. Dojrzałości korporacyjnej w zakresie zarządzania procesami związanymi z danymi nie mierzymy tylko na podstawie tego, jak firma radzi sobie z niską jakością danych.
Wszystkim nam dobrze znane są dwa wymiary w każdej organizacji: wymiar procesów biznesowych oraz wymiar systemów. Często na spotkaniach biznesowych padają zdania zaczynające się od „Według naszego procesu…” lub „W systemie X znajdują się…”. Wdrożenie praktyki Data Governance wprowadza nowy wymiar w organizacji – wymiar danych.
Dojrzałość przedsiębiorstwa w obszarze zarządzania danymi jest mierzona metrykami Data Governance. Metryki te zapewnią niezbędny wkład do monitorowania statusu wdrożenia oraz rozwoju Data Governance w przedsiębiorstwie.
Często spotykamy się z używaniem tych dwóch pojęć wymiennie. Tymczasem, zgodnie z DAMA Data Management Body of Knowledge, Data Management jest pojęciem szerszym, niż Data Governance.
Różnica miedzy Data Managenent a Data Governance
Aby odpowiednio wdrożyć wymiar danych, a następnie skutecznie zarządzać swoimi danymi, firmy muszą zadbać o kilka nierozłącznych elementów. Wiele lat doświadczeń w obszarze Data Governance pozwolił Deloitte wypracować ustrukturyzowane, wielokrotnie sprawdzone podejście do skutecznego wdrożenia oraz rozwoju praktyki – Deloitte Data Governance Framework. Framework pozwala zdefiniować wszystkie niezbędne elementy konieczne do zaadresowania podczas wdrożenia praktyki zarządzania danymi.
Każdorazowo przy wdrożeniu praktyki Data Governance, nasz sposób działania dostosowywany jest do organizacji. Pod uwagę brane są m.in. specyfika branży, wielkość firmy, ambicje w obszarze zarządzania danymi, czy poziom zaawansowania technologicznego. Aby wypracować „uszyte na miarę” podejście do wdrożenia Data Governance niezbędne jest również zrozumienie potrzeb biznesowych oraz problemów występujących przy pracy z danymi.
Deloitte Data Governance Framework
Deloitte Data Governance Framework strukturyzuje wdrożenie praktyki zarządzania danymi wokół sześciu głównych obszarów: