zawód przyszłości
kuratorka kurator danych
W erze, w której dane są kluczowym zasobem, jakość i wiarygodność zbiorów informacji bezpośrednio wpływa na odpowiedzi dostarczane przez narzędzia AI, wyniki badań oraz decyzje biznesowe. Kuratorzy danych dbają o to, aby dane były nie tylko dostępne, ale również wiarygodne i zarządzane w sposób odpowiedzialny. Powinni w ten sposób wspierać innowacje, utrzymując zaufanie publiczne do narzędzi opartych o nowe technologie.
Projekt „Zawody przyszłości w przemyśle 5.0” został nagrodzony przez Fundację Rozwoju Systemu Edukacji dofinansowaniem z środków UE. Celem projektu jest dotarcie z wiedzą na temat profesji, które będą istotne na rynku pracy za kilka lat, do uczniów szkół technicznych, studentów kierunków inżynierskich, młodych pracowników i edukatorów VET.
W skrócie o kuratorach danych
Organizują i ulepszają wysokiej jakości zbiory danych, żeby zapewnić ich użyteczność, wiarygodność i etyczność wykorzystania.
Pośredniczą pomiędzy etapem, kiedy dane są w stanie surowym, a momentem, kiedy staną się przydatne pod kątem zastosowania w modelach sztucznej inteligencji, procesach decyzyjnych i badaniach naukowych.
Odgrywają kluczową rolę w dbaniu o przejrzystość, uczciwość i efektywność systemów opartych na danych.
Porcja wiedzy na początek
Podstawowe pojęcia, które musisz znać
- Zarządzanie cyklem życia danych - proces organizowania, integrowania i utrzymywania danych w celu zapewnienia ich jakości, dostępności i użyteczności w czasie.
- Metadane - dodatkowe informacje opisujące dane, które ułatwiają wyszukiwanie, zarządzanie i ponowne wykorzystanie tych zbiorów.
- Nadzór nad danymi - zbiór zasad i praktyk zapewniających odpowiedzialne, skuteczne i etyczne postępowanie z danymi.
Rola kuratora danych
Kurator danych to specjalista, który zarządza całym cyklem życia danych – od gromadzenia i oczyszczania po dokumentację i długoterminowe przechowywanie.
Dba o to, aby zbiory danych były precyzyjne, dobrze zorganizowane i poszerzone o metadane, tak aby mogły być łatwo wykorzystywane przez naukowców, analityków, decision-makerów, a także przez systemy sztucznej inteligencji.
Z biegiem czasu specjalizacja kuratora danych może ewoluować w kierunku takich ról, jak specjalista ds. zarządzania danymi lub menadżer ds. etycznego wykorzystania danych w systemach sztucznej inteligencji. Osoby na podobnych stanowiskach będą brały odpowiedzialność zarówno za jakość techniczną, jak i etyczne wykorzystanie danych.
Nieustrukturyzowane i niewykorzystywane dane
Wraz z tym, jak dane stają się fundamentem niemal każdego przełomu technologicznego, rośnie zapotrzebowanie na wykwalifikowanych kuratorów danych.
IDC i Statista przewidują, że sumaryczna ilość danych na świecie wkrótce osiągnie 181 zettabajtów – czyli ponad dwukrotnie więcej niż wynosiła objętość takich zbiorów w 2023 roku. Wzrost pomiędzy rokiem 2024 a 2025 wynosił, według szacunków analityków, ok. 21 proc. (32 zettabajty).
Żeby zrozumieć, jakie jest tempo wzrostu objętości danych cyfrowych, warto sięgnąć do 2006 roku, kiedy IDC policzyło, że „cyfrowy świat” to ok. 161 exabajtów. 161 exabajtów to mniej niż jedna szósta 1 zettabajta. Aktualnie mówimy o liczbie 181 zettabajtów – zatem w ciągu 19 lat ilość danych powiększyła się ponad 1100 razy.
W warunkach tak dużego przyrostu i objętości zbiorów informacji – aż 80 proc. danych w przedsiębiorstwach pozostaje nieustrukturyzowanych lub niewykorzystanych.
I to czyni profesję kuratora danych niezbędną teraz i w przyszłości. Ponieważ narzędzia sztucznej inteligencji i uczenia maszynowego powinny opierać się na czystych, dobrze opisanych i zobiektywizowanych danych, kurator danych odgrywa podstawową rolę w kształtowaniu działania takich narzędzi, jak również w tym, czy modele AI będą podejmowały sprawiedliwe oceny. Bez odpowiedniego zarządzania danymi algorytmy mogą utrwalać uprzedzenia, naruszać prywatność lub generować błędne wnioski.
Dlatego zarówno sektor publiczny, jak i prywatne przedsiębiorstwa coraz częściej inwestują w poprawianie jakości danych. Według raportu Gartnera, ponad 70 proc. niepowodzeń dotyczących projektów AI wynika z niskiej jakości danych.
Integralność systemów wiedzy
Przyszły kurator danych nie będzie jedynie zarządzał plikami – stanie się strażnikiem integralności systemów wiedzy, przejrzystości sztucznej inteligencji i odpowiedzialności za decyzje oparte na danych. Rola ta ma charakter zarówno techniczny, jak i etyczny.
Wraz z wprowadzaniem nowych regulacji dotyczących danych i AI na całym świecie – wzrośnie zapotrzebowanie na specjalistów, którzy potrafią łączyć wiedzę technologiczną z rozumieniem społecznych konsekwencji wykorzystania danych.
Nieustannie rozwijająca się dziedzina
Obszar zarządzania danymi charakteryzuje się dużą dynamiką – standardy, narzędzia i zagadnienia etyczne stale zmieniają się. Kuratorzy danych muszą śledzić najnowsze metody w zakresie technologii przetwarzania informacji, standardów metadanych oraz zasad nadzoru i zarządzania danymi. Często współpracują z zespołami interdyscyplinarnymi, wdrażając dobre praktyki i dbając o zgodność procesów z obowiązującymi przepisami dotyczącymi ochrony danych.
Najważniejsze kompetencje twarde
- Biegłość w zarządzaniu danymi – umiejętność organizowania, przechowywania i utrzymywania dużych zbiorów danych z wykorzystaniem systemów i rozwiązań do magazynowania danych.
- Tworzenie metadanych – opracowywanie i stosowanie standardów metadanych do zwiększania wykrywalności, interoperacyjności i użyteczności danych.
- Zapewnienie wysokiej jakości danych – kompetencje w zakresie czyszczenia, walidacji i audytu danych, gwarantujące ich dokładność, spójność i wiarygodność.
- Zarządzanie danymi – znajomość zasad i procedur zapewniających integralność danych oraz zgodność z obowiązującymi przepisami.
- Integracja danych – doświadczenie w procesach ETL (Extract, Transform, Load) i w pracy z narzędziami służącymi do konsolidacji danych z różnych źródeł.
- Podstawowa znajomość programowania – umiejętność posługiwania się językami SQL lub Python w celu usprawnienia pracy z danymi i automatyzacji powtarzalnych zadań.
- Środowiska chmurowe – znajomość platform takich, jak AWS, Azure czy Google Cloud Platform oraz rozumienie podstawowych zasad architektury danych w chmurze.
- Wizualizacja danych i storytelling – zdolność do przekładania danych na zrozumiałe narracje, które pomagają w podejmowaniu decyzji i angażują odbiorców.
- Wiedza o sztucznej inteligencji – rozumienie zasad działania modeli AI, wpływu danych na ich stronniczość oraz roli kuratorów danych w zapewnianiu uczciwości i przejrzystości algorytmów.
Najważniejsze kompetencje miękkie
- Dbałość o szczegóły – skrupulatność i precyzja w pracy z danymi, pozwalające zapobiegać błędom i utrzymywać wysokiej jakości standardy.
- Komunikacja – umiejętność jasnego i przystępnego przekazywania złożonych informacji osobom spoza branży technicznej.
- Współpraca – efektywna praca w zespołach interdyscyplinarnych, obejmujących m.in. specjalistów IT, prawników i analityków biznesowych.
- Ocena etyczna – zdolność podejmowania odpowiedzialnych decyzji z uwzględnieniem kwestii prywatności, zgód i konsekwencji wykorzystania danych.
- Ciekawość i rozwój – chęć ciągłego uczenia się, poszukiwania nowych narzędzi, technologii i standardów.
Certyfikaty
Uzyskanie certyfikatów branżowych, takich jak Certified Data Management Professional (CDMP) lub Certified Information Management Professional (CIMP) potwierdzi wiedzę specjalistyczną kuratora danych. Wzmocni też jego zaangażowanie w stosowanie dobrych praktyk w zakresie zarządzania informacją. W tej dziedzinie kluczowy będzie ciągły rozwój kompetencji poprzez udział w warsztatach i kursach poświęconych etyce w zarządzaniu danymi i ochronie prywatności.
W nagraniu filmowym możesz posłuchać Marty Barcickiej z Neuron Cube, która opowiada o perspektywach pracy w roli osoby, która zajmuje się porządkowaniem i zarządzaniem danymi.
Ścieżka kariery
Ścieżka kariery kuratora danych jest zarazem uporządkowana i elastyczna – odzwierciedla zmienny charakter współczesnych ekosystemów danych. Jako opiekunowie złożonych i często wrażliwych zbiorów informacji, przyszli kuratorzy danych muszą łączyć interdyscyplinarne przygotowanie akademickie, biegłość techniczną i wrażliwość etyczną. Ta profesja wymaga nie tylko umiejętnego posługiwania się narzędziami i standardami zarządzania danymi, lecz także głębokiego zrozumienia przepływu informacji w infrastrukturze cyfrowej, instytucjach i społeczeństwach. Przygotowanie do tej roli oznacza rozwijanie krytycznego myślenia, dbałości o szczegóły oraz gotowości do ciągłego uczenia się w świecie zdominowanym przez dane.
krok 0
Zdobądź podstawowe doświadczenia w pracy z danymi przez projekty szkolne, hackathony dotyczące otwartych danych lub dzięki platformom edukacyjnym online.
Zapoznaj się z kursami wprowadzającymi do nauki o danych, uczestnicz w webinariach dotyczących prywatności informacji oraz w inicjatywach społecznych lub obywatelskich związanych z danymi, aby zdobyć nie tylko wiedzę teoretyczną, ale i pierwsze praktyczne umiejętności.
Rozpocznij studia np. na kierunku data science, ale wbrew pozorom dobrym wyborem będzie też bibliotekoznawstwo i informacja naukowa, bo nauczysz się porządkowania i strukturyzowania danych.
Z kolei data science wprowadzi cię w obszar inżynierii skupionej na zbiorach informacji. Po uzyskaniu tytułu licencjata, poszukaj studiów magisterskich np. z obszaru modelowania albo etyki danych.
- Dziedziny, na których warto się skupić:
- zarządzanie bazami danych
- modelowanie danych
- architektura informacji
- etyka i prywatność danych
krok 1
krok 2
Nawet jeśli jeszcze nie masz pracy związanej z zarządzaniem danymi, uczestnicz w kursach, które pomogą ci w rozwijaniu kompetencji w konkretnych subdziedzinach. Mogą to być szkolenia z zarządzania jakością danych albo skupione na standardach metadanych.
- Pogłębiaj kompetencje dzięki kursom z zakresu:
- standardów metadanych (np. Dublin Core, Schema.org)
- zarządzania jakością danych
- zarządzania danymi w organizacjach
- narzędzi takich, jak Talend, Informatica czy Apache NiFi
- Szukaj staży lub praktyk w takich rolach, jak:
- asystent ds. zarządzania danymi
- młodszy analityk danych
- archiwista cyfrowy
W ten sposób możesz zdobyć praktyczne doświadczenie w zakresie obsługi danych, zapewniania jakości oraz pracy w zespołach interdyscyplinarnych. Możesz także uczestniczyć w projektach badawczych na uczelni lub w inicjatywach prowadzonych przez organizacje pozarządowe.
krok 3
krok 4
Kiedy zdobędziesz już stałe zatrudnienie na stanowisku związanym z danymi, pracuj nad rozwojem zawodowym w kierunku zdobycia roli specjalisty ds. danych. Później twoja ścieżka kariery może prowadzić np. do funkcji dyrektora ds. odpowiedzialnej sztucznej inteligencji.
- Staraj się awansować na stanowiska takie, jak:
- specjalista ds. danych
- główny specjalista ds. danych
- dyrektor ds. danych
- W dalszej perspektywie kariera może prowadzić do ról z obszaru sztucznej inteligencji takich, jak:
- dyrektor ds. ochrony prywatności
- dyrektor ds. etycznego zarządzania danymi
- dyrektor ds. odpowiedzialnej sztucznej inteligencji
Kontynuuj rozwój zawodowy, zdobywając stopnie naukowe, uczestnicząc w konferencjach branżowych i śledząc najnowsze trendy w zakresie etyki danych oraz technologii informacyjnych.
krok 0
Zdobądź podstawowe doświadczenia w pracy z danymi przez projekty szkolne, hackathony dotyczące otwartych danych lub dzięki platformom edukacyjnym online.
Zapoznaj się z kursami wprowadzającymi do nauki o danych, uczestnicz w webinariach dotyczących prywatności informacji oraz w inicjatywach społecznych lub obywatelskich związanych z danymi, aby zdobyć nie tylko wiedzę teoretyczną, ale i pierwsze praktyczne umiejętności.
krok 1
Rozpocznij studia np. na kierunku data science, ale wbrew pozorom dobrym wyborem będzie też bibliotekoznawstwo i informacja naukowa, bo nauczysz się porządkowania i strukturyzowania danych.
Z kolei data science wprowadzi cię w obszar inżynierii skupionej na zbiorach informacji. Po uzyskaniu tytułu licencjata, poszukaj studiów magisterskich np. z obszaru modelowania albo etyki danych.
- Dziedziny, na których warto się skupić:
- zarządzanie bazami danych
- modelowanie danych
- architektura informacji
- etyka i prywatność danych
krok 2
Nawet jeśli jeszcze nie masz pracy związanej z zarządzaniem danymi, uczestnicz w kursach, które pomogą ci w rozwijaniu kompetencji w konkretnych subdziedzinach. Mogą to być szkolenia z zarządzania jakością danych albo skupione na standardach metadanych.
- Pogłębiaj kompetencje dzięki kursom z zakresu:
- standardów metadanych (np. Dublin Core, Schema.org)
- zarządzania jakością danych
- zarządzania danymi w organizacjach
- narzędzi takich, jak Talend, Informatica czy Apache NiFi
krok 3
- Szukaj staży lub praktyk w takich rolach, jak:
- asystent ds. zarządzania danymi
- młodszy analityk danych
- archiwista cyfrowy
W ten sposób możesz zdobyć praktyczne doświadczenie w zakresie obsługi danych, zapewniania jakości oraz pracy w zespołach interdyscyplinarnych. Możesz także uczestniczyć w projektach badawczych na uczelni lub w inicjatywach prowadzonych przez organizacje pozarządowe.
krok 4
Kiedy zdobędziesz już stałe zatrudnienie na stanowisku związanym z danymi, pracuj nad rozwojem zawodowym w kierunku zdobycia roli specjalisty ds. danych. Później twoja ścieżka kariery może prowadzić np. do funkcji dyrektora ds. odpowiedzialnej sztucznej inteligencji.
- Staraj się awansować na stanowiska takie, jak:
- specjalista ds. danych
- główny specjalista ds. danych
- dyrektor ds. danych
- W dalszej perspektywie kariera może prowadzić do ról z obszaru sztucznej inteligencji takich, jak:
- dyrektor ds. ochrony prywatności
- dyrektor ds. etycznego zarządzania danymi
- dyrektor ds. odpowiedzialnej sztucznej inteligencji
Kontynuuj rozwój zawodowy, zdobywając stopnie naukowe, uczestnicząc w konferencjach branżowych i śledząc najnowsze trendy w zakresie etyki danych oraz technologii informacyjnych.
Ścieżka kariery może prowadzić do specjalizacji, np. kuratora danych medycznych (kliniczne zbiory danych, środowiska o wysokich wymaganiach w zakresie prywatności), kuratora danych naukowych (repozytoria otwartych danych, dane dotyczące klimatu) lub kuratora danych korporacyjnych (dane dot. klientów). Możliwy jest również rozwój naukowy w roli wykładowcy, doradcy ds. polityk czy członka międzynarodowych organizacji standaryzacyjnych.
Pobierz materiały, które ułatwią Ci przekazanie uczniom wiedzy o tym zawodzie
Projekt realizują
Podstrona poświęcona zawodowi jest częścią kampanii edukacyjnej „Zawody przyszłości w przemyśle 5.0”. Numer projektu: 2024-1-PL01-KA210-VET-000246422.
Dofinansowane ze środków UE. Wyrażone poglądy i opinie są jedynie opiniami autora lub autorów i niekoniecznie odzwierciedlają poglądy i opinie Unii Europejskiej lub Fundacji Rozwoju Systemu Edukacji. Unia Europejska ani Fundacja Rozwoju Systemu Edukacji nie ponoszą za nie odpowiedzialności. Wszystkie rezultaty opracowane w ramach projektu „Zawody przyszłości w przemyśle 5.0” są udostępniane na otwartej licencji Creative Commons Attribution – ShareAlike 4.0 International (CC BY-SA 4.0). Dozwolone jest ich nieodpłatne rozpowszechnianie, pod warunkiem wskazania autorstwa oraz źródła finansowania projektu.