Serwis korporacyjny
 APA Group  

Artykuły

Big data, dane w mediach społecznościowych

Z artykułu dowiesz się:

  • Czym jest data mining i w jaki sposób analizuje się zebrane dane. 
  • W jaki sposób firmy wykorzystują “ślad cyfrowy” do tworzenia kampanii marketingowych. 
  • Jak politycy wykorzystują Big Data przed wyborami. 
  • Czy prywatność może być “kosztem ubocznym” w kontekście innych korzyści.

Nie od dziś mówi się o tym, że media społecznościowe gromadzą nasze dane. Zdecydowana większość osób ma świadomość tego, że w całym tym procesie dochodzi do “handlowania prywatnością”, jednak rzadko kiedy zastanawiamy się nad funkcjonowaniem zaangażowanych w to technologii. Pora więc zgłębić ten temat.

W ostatnich miesiącach prawdziwą sensacją okazał się Netflixowski dokument pt. “Social dilemma”, w którym wypowiadają się byli wyspecjalizowani pracownicy największych społecznościowych gigantów. Mówią oni o tym, w jaki sposób działają media społecznościowe, szczerze i bezkompromisowo obnażając poszczególne mechanizmy, będące użytkowników uzależniające tak jak narkotyk. W wywiadach pojawiało się też sporo odniesień do Big Data. 

Big Data, czyli dane na wagę złota 

Na początek warto wyjaśnić, czym w ogóle Big Data jest. To rozbudowana technologicznie metoda wyszukiwania, pobierania, gromadzenia i analizowania danych z różnych rozproszonych źródeł, w celu realizacji różnych celów, głównie komercyjnych. 

Działa to w ten sposób, że zbiera się dane od milionów, a w niektórych przypadkach nawet od miliardów użytkowników sieci i na tej podstawie tworzy się profile konsumenckie, polityczne, psychologiczne itd. Na przykład takie cechy jak młody wiek, ekstrawertyzm, skłonność do poszukiwania nowych wrażeń, obserwowanie dużych marek i korzystanie z przyjemności wielkomiejskiego świata tworzy idealny profil osoby potencjalnie zainteresowanej zakupem najnowszego modelu sportowego obuwia od modnego producenta. 

dane

Najbardziej interesującym dla specjalistów ds. marketingu źródłem pozyskiwania danych są media społecznościowe. Informacje tam gromadzone mają tę interesującą cechę, że po pierwsze są dostarczane z własnej woli przez samych użytkowników (nawet jeśli wielu z nich “kreuje” swoje wymarzone życie, a nie pokazuje swoją prawdziwą codzienność, nie ma to znaczenia), a po drugie – można je analizować pod kątem zawartości słów kluczowych oraz reakcji emocjonalnych (“lajki” i komentarze) na różne zamieszczane na platformach treści. W wielu przypadkach możliwe jest także odczytywanie danych z postowanych zdjęć, gdzie pojawia się na przykład logo danej marki. 

No dobrze, ale w jaki sposób tak ogromny zasób wiedzy, jakim jest zbiór danych, daje się segregować? W tym celu wykorzystuje się algorytmy, takie jak MapReduce, które rozpraszają wprowadzone zbiory dane pomiędzy różne serwery, a te mają za zadanie uporządkować je, a następnie wybrać rekordy związane bezpośrednio z regułami zapytania. Tak uzyskane wyniki następnie są gromadzone i przetwarzane do postaci wynikowej. 

Do przeprowadzania pomiarów Big Data wykorzystuje się ponadto takie narzędzia jak: 

  • Hadoop (platforma Java do rozproszonego składowania i przetwarzania wielkich zbiorów danych), 
  • Flume (oprogramowanie do wydajnego gromadzenia, agregowania i przenoszenia dużych ilości danych), 
  • Lucene (przeznaczone do przeszukiwania plików tekstowych), 
  • Cassandra (magazyn baz danych). 

Ponadto trzeba wspomnieć o algorytmach do zgłębiania danych (ang. data mining), takich jak RapidMiner czy Mahout. Data mining to proces analityczny, który polega na analizowaniu ogromnych zbiorów danych w poszukiwaniu powtarzalnych wzorców i współzależności między zmiennymi. W kolejnych etapach dochodzi do oceniania zebranych wyników.  

Jak zbiera się informacje o nas i co one “mówią”? 

Jak już zostało powiedziane, Big Data umożliwiają przewidywanie zachowań ludzi na podstawie pozostawianych w internecie danych. No właśnie  –  słowo “pozostawiane” ma tu ogromne znaczenie, bo naszą aktywność w sieci można porównać do znaczenia terenu, zostawiania po sobie śladów. To tak zwany digital footprint, czyli, dosłownie, ślad sieciowy (analogicznie do carbon footpront, czyli do “śladu węglowego”). 

Korzystasz z Facebooka, Twittera, Instagrama lub LinkedIn? Pozostawiasz po sobie ślad. Nie do wiary? Ciekawą perspektywę daje skorzystanie z narzędzia Apply Magic Source, oprogramowania udostępnionego za darmo online przez Uniwersytet w Cambridge. Można do niego dodać kopię zebranych danych z mediów społecznościowych (taki zapakowany plik można pobrać bezpośrednio ze swojego Facebooka, w zakładce “Ustawienia”) i uzyskać… analizę swojej osobowości internetowej, czyli zyskać dosłowny wgląd w to, do czego mają dostęp na przykład twórcy wielkich kampanii marketingowych. 

dane

Co konkretnie daje niektórym podmiotom analiza Big Data? Przede wszystkim cenne informacje na temat potencjalnych i rzeczywistych zachowań konsumenckich. W ten sposób marki są w stanie lepiej i bardziej skutecznie zaplanować swoje kampanie reklamowe. To przełom, biorąc pod uwagę, że jeszcze kilkanaście lat temu jedyną formą przeprowadzania podobnych analiz były badania ankietowe, które przecież były czasochłonne, kosztowne i nie zawsze efektywne. Tymczasem  – jak twierdzi Fronzetti Coladon, pracownik naukowy MIT w rozmowie z Newseria Innowacje – Big Data pozwalają […] przeanalizować zachowania i uchwycić wiarygodne sygnały dotyczące prawdziwych zachowań i subtelnych schematów interakcji. 

Przedsiębiorstwa, zwłaszcza te dominujące na światowych rynkach, coraz chętniej korzystają z badania dużych zbiorów danych. Szczególnie interesujące są dla nich media społecznościowe, które dostarczają niekiedy unikalnych informacji o dużym stopniu wiarygodności. „Raport strategiczny Internet 2019/2020 IAB Polska wskazuje na to, że w roku 2019 wartość rozwojowa reklamy cyfrowej w Polsce osiągnęła prawie 5 mld złotych. Tym samym nakłady na reklamę w sieci “prześcignęły” te telewizyjne, i to po raz pierwszy w historii. 

Dr Michał Kosiński, psycholog społeczny i data scientist, w swoich badaniach udowadnia, że dzięki analizie Big Data w mediach społecznościowych konkretne instytucje mogą coraz lepiej przewidywać cechy osobowości i zachowania ludzi. Na podstawie ponad 200 polubień na Facebooku algorytm jest w stanie z dużą precyzyjnością odgadnąć, jakie będą odpowiedzi danego użytkownika w klasycznym psychologicznym kwestionariuszu osobowości. 

Wynika to z typu dostępnych na platformach interakcji (zamieszczanie zdjęć, dzielenie się własnymi przemyśleniami w formie postów, komentowanie, reagowanie za pomocą emotek); z możliwości technologicznych platform (np. analizowanie przez algorytmy czasu poświęconego na interakcję z danym fanpagem, grupą lub innym użytkownikiem); ale także z faktu, że użytkownicy social media chętnie dostarczają treści z własnej woli, bo jest to dla nich forma rozrywki, podtrzymywania więzi ze znajomymi itd. 

Potencjał, również w Polsce, jest spory, bo  – jak wynika z raportu “Digital 2019”  – w naszym kraju niemal 80% obywateli jest użytkownikami internetu, a aż 47% to aktywni użytkownicy mediów społecznościowych. 

Osobowość wyczytana ze zdjęć 

Big Data to głównie analizowanie danych tekstowych. Ale równie duże, a może nawet większe możliwości dają zdjęcia zamieszczane w social mediach. 

Badania wspomnianego dra Kosińskiego ukazują bardzo interesujący obraz (sic!) zjawiska. Okazuje się, że na przykład ekstrawertycy decydują się na inny makijaż niż osoby skryte z bogatym życiem wewnętrznym. Inaczej robią także selfie i częściej wybierają soczewki kontaktowe zamiast okularów. 

Algorytm do rozpoznawania twarzy jest coraz bardziej inteligentny i obecnie jest już w stanie odgadnąć nawet… orientację seksualną konkretnego użytkownika. U mężczyzn prawdopodobieństwo “dobrego obstawienia” wynosi aż 90 procent. 

dane

Co to daje podmiotom najbardziej zainteresowanym? Marketerzy mogą na przykład wyjść do odbiorców z dwiema kampaniami reklamowymi – jedna będzie nakierowana na introwertycznych heteroseksualistów, a druga na uwielbiających społeczne interakcje homoseksualistów. 

Kampanie dostosowane do pojedynczego wyborcy 

Nie chodzi jednak wyłącznie o kampanie marketingowe. Big Data jest dziś powszechnie wykorzystywane także w świecie polityki, o czym było głośno w kontekście wyborów w 2016 roku w USA (w tym temacie polecamy np. dokument “Hakowanie świata” z 2019 roku).  

Jak twierdzi dr Olha Zadorozhna z Zakładu Ekonomicznych Analiz Empirycznych Akademii Leona Koźmińskiego: Masowa analiza danych z pomocą sztucznej inteligencji i innych skomplikowanych metod pozwala obecnie już dość dokładnie przewidzieć wynik wyborów i maksymalnie skutecznie oddziaływać na wyborców.  Za pomocą tak zwanego mikrotargetowania różni ludzie mogą otrzymać od platformy najlepiej dopasowaną do nich wersję kampanii wyborczej, która będzie odmienna od wersji “sąsiada z piętra niżej”. 

Dane, z których korzystają osoby odpowiedzialne za polityczną agendę, to na przykład informacje na temat pochodzenia użytkowników, ich koloru skóry, preferencji zakupowych, zainteresowań itd. Metody eksploracji danych, w połączeniu z technikami uczenia maszynowego i ekonometrycznymi, dają niemal nieskrępowany wgląd w potencjalny kierunek ideowy danego wyborcy, ale także w jego głęboko skrywane pragnienia i oczekiwania. 

Przykład? Im bardziej skrajne są poglądy konkretnego użytkownika, tym większa jego skłonność do tego, by na przykład popierać pomysł utworzenia muru odgradzającego się od Meksykanów. 

“Sprzedamy ci to, czego pragniesz (ale o tym nie wiesz)” 

Wszystko to może brzmieć zaskakująco dla kogoś, kto po raz pierwszy spotyka się z koncepcją Big Data. Wątpliwości mogą wynikać głównie z tego, że przecież mowa o czymś tak wrażliwym jak dane i prywatność, a te dla wielu osób są ogromną wartością. Jak to możliwe, że wykorzystuje się je do tak “niecnych” celów jak maksymalizowanie zysków czy osiągnięcie władzy? 

Oczywiście pojawia się mnóstwo głosów negatywnych, które otwarcie krytykują taki stan rzeczy. Obawy zgłasza zarówno społeczeństwo, jak i organizacje pozarządowe czy wreszcie instytucje ponadnarodowe, takie jak Unia Europejska. 

Problem polega jednak na tym, że w większości państw media społecznościowe są poza jakimikolwiek regulacjami prawnymi. Funkcjonują one w takim kształcie od niedawna, a ich funkcjonalności zmieniają się praktycznie z dnia na dzień, ze względu na rozwój technologii. 

Drugą kwestią jest to, że wiele “nieetycznych” działań administratorów platform jest nie do wykrycia. Na przykład konkretną kampanię jest w stanie zobaczyć tylko osoba o określonym profilu osobowości. W dodatku może ją widzieć tylko przez jakiś czas, bo na przykład już po odświeżeniu tablicy na Facebooku reklama może nie pojawić się po raz drugi. Jak więc kontrolować coś tak ulotnego i tak rozproszonego zarazem? 

dane

Big data = big disappointment? 

Nie można jednak zapominać o tym, że wspomniane wyżej minusy to tylko jedna ze stron medalu. Na przykład wielu użytkowników social mediów wprost mówi o tym, że ceni sobie to, że interesujące ich oferty czy treści “same do nich przychodzą”, a oni nie muszą wykonywać żadnych dodatkowych działań. 

Oczywiście to z kolei grozi tzw. bańką informacyjną, czyli krążeniem w obrębie wyłącznie wybranych publikacji i zamknięcie się na to, co poza nimi, na przykład na inne opinie lub inną rzeczywistość. Te kwestie nie są więc czarno-białe. 

Korzyści są też bardziej “makro”, bo dzięki Big Data można na przykład wyszukiwać osoby, które są bliskie samobójstwa lub zamierzają popełnić jakieś przestępstwo. Choć być może nie zdajemy sobie z tego do końca sprawy, to przecież z zaawansowanego data mining korzystają dziś także usługi publiczne czy administracja państwowa. 

W oparciu o bieżącą analizę danych można sprawnie reagować na incydenty związane z łamaniem prawa i dbać o bezpieczeństwo publiczne. W ten sposób wdraża się ponadto rozwiązania służące wszystkim klientom, ponieważ banki wykorzystują Big Data do poprawy cyberbezpieczeństwa, a Poczta Polska  optymalizuje w ten sposób transport listów i paczek.

Rzeczywiście, prywatność jest swego rodzaju “daniną” czy “podatkiem”, ale odprowadzanym w zamian za wygodę i poczucie wolnego dostępu do informacji.

1 Gwiazda2 Gwiazdki3 Gwiazdki4 Gwiazdki5 Gwiazdek (oddanych głosów: 2 średnia: 5,00 z 5)
Loading...


Zobacz również