Rozwój nowoczesnych technologii, w tym zwłaszcza uczenia maszynowego czy generatywnej sztucznej inteligencji, zwiększa możliwości statystyków. Mogą oni korzystać z nowych źródeł danych i poddawać szybkiej analizie duże zasoby informacji. Wraz z rozwojem narzędzi informatycznych zmienia się też sposób, w jaki odbiorcy poszukują danych statystycznych. Opracowania przygotowywane przez jednostki takie jak Główny Urząd Statystyczny czy Eurostat będą musiały konkurować z tymi, które przygotowują podmioty niewyspecjalizowane lub nawet modele językowe, bazujące często na niepewnych źródłach.
– Statystyka bardzo korzysta na transformacji cyfrowej, zaczynając od bardzo ogólnego tematu, jakim jest efektywność. Nakłady, które są przeznaczane na statystykę, przez lata nie rosną, natomiast liczba statystyk i informacji, które udostępniamy, a także ich zakres, bardzo dynamicznie wzrasta każdego roku. Już z tego punktu widzenia widać, jak bardzo cyfryzacja pomaga statystyce publicznej. Tworzy również pewne wyzwania, ale i możliwości, które chcemy podjąć – podkreśla w rozmowie z agencją Newseria Innowacje dr Dominik Rozkrut, prezes Głównego Urzędu Statystycznego.
Jak dodaje, statystycy korzystają z nowych, czasem także eksperymentalnych źródeł danych, a także technik ich pozyskiwania i obróbki (również autorskich) i wykorzystują je do tego, żeby społeczeństwo uzyskiwało dostęp do jak najlepszego zasobu opracowań. W spektrum zainteresowania GUS są takie źródła informacji jak m.in. zdjęcia satelitarne (np. do statystyk związanych z rolnictwem, pozycjonowania statków na morzu czy zbierane w czasie rzeczywistym statystyki natężenia ruchu na drogach, a także te, które dostarczają operatorzy kart płatniczych czy dostawcy usług telekomunikacyjnych).
– To wszystko nowe źródła danych, których wcześniej nie było. Nie mieliśmy możliwości korzystania z nich, bo one po prostu nie istniały. Natomiast dzisiaj otwierają się zupełnie nowe możliwości – mówi prezes GUS.
W lipcu w Warszawie odbył się IV Kongres Statystyki Polskiej, podczas którego dużo miejsca poświęcono dyskusji o znaczeniu nowych technologii w statystyce. Jedna z prelegentek, Mariana Kotzeva z Eurostatu, w swojej prezentacji zwracała uwagę na to, że zwłaszcza generatywna sztuczna inteligencja zmienia sposób, w jaki użytkownicy uzyskują dostęp do danych. Korzystanie z takich rozwiązań jest obarczone dużym ryzykiem pozyskania błędnych danych, co przekłada się na ograniczone zaufanie odbiorców. Mimo to najbliższa przyszłość rysuje się tak, że oficjalne statystyki będą musiały konkurować o odbiorców z tymi dostarczanymi z nieautoryzowanych opracowań, powstających nierzadko na podstawie niepewnych i nieustrukturyzowanych danych.
– Pytanie o jakość jest bardzo dobrym pytaniem. Mieliśmy pewne utarte sposoby kontroli jakości w tradycyjnych metodach badań statystycznych, natomiast wszystkie nowe źródła danych oczywiście dają wielkie możliwości, ale są też wyzwaniem, jeżeli chodzi o otrzymanie jakości. Integracja źródeł o różnym charakterze powoduje, że zapanowanie nad jakością jest trudniejsze. Ale poświęcamy temu dużo uwagi. Łączymy w tym siły z innymi urzędami statystycznymi na świecie, z Eurostatem, OECD, Organizacją Narodów Zjednoczonych i wypracowujemy odpowiednie metody, techniki, regulacje, które pozwolą nam dobrze komunikować jakość i również o nią dbać – deklaruje dr Dominik Rozkrut.
W ocenie eksperta duże zbiory danych mogą dostarczyć cennych informacji statystycznych praktycznie w każdej dziedzinie.
– To są dane, które pozwalają nam na zwiększenie dokładności, precyzji i szczegółowości tych wyników, które prezentujemy, ale także poznawanie rzeczy i zjawisk, których wcześniej nie mogliśmy badać, właśnie ze względu na ograniczenia tradycyjnych instrumentów badawczych. Potencjał jest olbrzymi, a Główny Urząd Statystyczny stara się nawiązywać współpracę z gestorami tych nowych źródeł danych. One czasami mają charakter publiczny, ale w znacznej mierze są to dane gestorów prywatnych. Podejmujemy współpracę, zawiązujemy partnerstwa po to, żeby jak najszerzej korzystać z tych danych – informuje prezes GUS.
Źródło: Newseria