• Nie Znaleziono Wyników

[2019/Nr 2] Google Trends jako narzędzie wykorzystujące Big Data w naukach żywieniowych

N/A
N/A
Protected

Academic year: 2021

Share "[2019/Nr 2] Google Trends jako narzędzie wykorzystujące Big Data w naukach żywieniowych"

Copied!
6
0
0

Pełen tekst

(1)

Ewa Błaszczyk-Bębenek, Paweł Jagielski, Małgorzata Schlegel-Zawadzka

GOOGLE TRENDS JAKO NARZĘDZIE WYKORZYSTUJĄCE BIG DATA W NAUKACH ŻYWIENIOWYCH

Zakład Żywienia Człowieka, Instytut Zdrowia Publicznego, WNZ, UJ CM, Kraków

Kierownik: prof. dr hab. M. Schlegel-Zawadzka

Hasła kluczowe: żywienie, Internet, Infodemiologia, Big Data, Google Trends. Key words: nutrition, Internet, Infodemiology, Big Data, Google Trends.

Wzrost dostępności do Internetu oraz wykorzystywanie go w celu zdobycia in-formacji (poprzez słowa kluczowe lub całe zwroty), w naturalny sposób buduje duże zbiory danych z ang. Big Data. W 2018 r. wg danych Głównego Urzędu Sta-tystycznego dostęp do Internetu posiadało 84,2% gospodarstw domowych i był to odsetek wyższy o 8,4 punktu procentowego, w stosunku do 2015 r. Odsetek osób, które korzystały z Internetu w 2018 r. wyniósł 77,5% (1). Big Data, które powstają poprzez wykorzystanie wyszukiwarek internetowych jak np. Google stanowią bazę informacji o użytkownikach Internetu, ich zainteresowaniach oraz aktualnych po-trzebach (2). W charakterystyce Big Data wykorzystuje się model opierający się na trzech zmiennych tzw. model 3V, który obejmuje dużą liczbę danych (ang. volume), dużą prędkość przetwarzania danych (ang. velocity) oraz dużą różnorodność danych (ang. variety) (3). Wszystkie te elementy wpisują się w opis danych, które możemy uzyskać z wyszukiwarki Google poprzez analizę narzędzia jakim jest np. Trendy Google ang. Google Trends (GT). Wykorzystanie danych zebranych za pomocą źró-deł elektronicznych oraz ich analiza nazywa się Infodemiologią (4), która z uwagi na łatwość dostępu zyskuje coraz większą popularność również wśród naukowców.

Celem pracy jest opis narzędzia jakim jest Google Trends i przedstawianie moż-liwości jego wykorzystania w aspekcie nauk żywieniowych na podstawie dostępnej literatury.

CHARAKTERYSTYKA NARZĘDZIA GOOGLE TRENDS

Google Trends to bezpłatne narzędzie wspomagające, zarówno do analizy zmian w trendach dotyczących najpopularniejszych wyszukiwań związanych np. ze zdro-wiem jak również bieżącego śledzenia popularności haseł w danym obszarze tema-tycznym (5–7). Dane w GT pochodzą z wyszukiwarki Google. Jedynie niewielki odsetek wyszukiwań jest używany do kompilowania danych w GT. Pokazywane

(2)

wyniki to losowa próbka danych z wyszukiwarki Google. Wpisanie tego samego ha-sła w przeciągu kilku dni skutkuje różnicami w czasie od kilku do kilkunastu punk-tów względnej liczby wyszukiwań (ang. Relative Search Volume, RSV). Ogólny trend jest zachowany, jednak wiąże się to z brakiem dokładnej powtarzalności (8). Pomijane są hasła z małą liczbą wyszukiwań oraz identyczne zapytania wpisywane przez tego samego użytkownika w krótkich odstępach czasu. Wyniki wyszukiwania w GT są wyświetlane proporcjonalne do czasu i lokalizacji wyszukiwania (ryc. 1) (9). Zakres danych jest ograniczony czasowo i obejmuje dane dopiero od 2004 roku do dnia bieżącego. Istnieje jednak kilka opcji wyboru zakresu czasu, z jakie-go chcemy otrzymać analizę np. z danejakie-go dnia, miesiąca, roku czy przedziału lat.

Opis wyglądu strony GT oraz funkcjonalności pól wyboru, zostały przedstawione na ryc. 1 i 2. Po wpisaniu wyszukiwanego hasła lub wyrażenia, które nas interesuje (punkt 1 na ryc. 1), jak też wybraniu innych opcji dotyczących wyszukiwanego zapytania (punkty 2–6 na ryc. 1), wyświetlany jest wykres. Jednocześnie, możliwe jest porównanie do 5. haseł lub wyrażeń na jednym wykresie. Wyniki wyszukiwań różnych haseł z tego wielokrotnego porównania są przedstawione w odniesieniu do tego hasła, które było najpopularniejsze (ryc. 1). Możliwe jest także porównanie do 5. haseł, pochodzących z różnych państw świata (należy zwrócić uwagę na zapis hasła w języku wyszukania) np. odchudzanie (w Polsce) i weightloss (Stany Zjed-noczone). Dodatkowe informacje dla zadanego wyszukiwania to podział na regiony, jak też prezentacja podobnych haseł zyskujących popularność lub najpopularniej-szych (ryc. 2). Dane z wykresu można eksportować w formacie csv, a następnie dowolnie analizować.

Ryc. 1. Widok strony internetowej Google Trends z wynikiem wyszukania na wykresie w ujęciu czasowym. Fig. 1. Google Trends website view with the result of a time-based chart search.

1 – pole do wpisania wyszukiwanego hasła; 2 – możliwość dodania innych haseł do porównania, maksy-malnie 5 haseł; 3 – możliwość wyboru konkretnego kraju lub ustawienia opcji wyszukiwania dla całego świata; 4 – pole wyboru zakresu czasu wyszukiwania; 5 – pole zawężenia wyszukiwania do tematów; 6 – pole wyboru wyszukiwania w Google lub YouTube; 7 – możliwość eksportu danych widocznych na wykresie w formacie csv; 8 – wykres przedstawiający popularność wybranego hasła w danym przedziale czasowym.

(3)

Ryc. 2. Widok strony internetowej Google Trends z wynikiem wyszukania w ujęciu geografi cznym oraz popularności podobnych haseł.

Fig. 2. Google Trends website view with the result of a geographical search and the popularity of similar passwords.

1 – pole wyboru, podregion lub miasto; 2 – pole wyboru podobnego tematu, zyskujące popularność lub najpopularniejsze; 3 – pole wyboru podobnego zapytania, zyskujące popularność lub najpopularniejsze

Opcja „Podobne zapytania” pokazuje, które wyrażenia podobne do wyszukiwa-nego są równie często wpisywane w wyszukiwarkę internetową z dwiema opcjami do wyboru: „najpopularniejsze” lub „zyskujące popularność”. Po wybraniu opcji „zyskujące popularność” wyświetlają się wyrażenia z podaną wartością procentową wzrostu w porównaniu do poprzedniego okresu (ryc. 2). W przypadku, gdy zamiast procentu pojawia się słowo „Przebicie”, oznacza to, że hasło uzyskało wzrost prze-kraczający 5000% (8).

Nuti i współpr. (5) opracowali listę kontrolną do procedury wyszukiwania

infor-macji na podstawie GT, która powinna stanowić dobrą praktykę przy wykorzystaniu tego narzędzia do badań i publikacji naukowych.

W działalności związanej z żywnością i żywieniem, zarówno w ujęciu komercyj-nym jak i naukowym, wykorzystanie danych z GT jest możliwe, jednak wymaga ostrożności przy wnioskowaniu z uzyskanych danych. Otoczenie biznesowe czy blogerzy zajmujący się tematyką żywieniową już wykorzystują to narzędzie spraw-dzając jakie hasła zyskują popularność w Internecie i reagując na zapotrzebowanie internautów (zakładając portale czy blogi o tej tematyce). Należy pamiętać o ograni-czeniach tego narzędzia jak m.in. niewystarczająca dokumentacja metodologii dzia-łania GT (4, 6), brak informacji o użytkownikach Internetu (np. płeć, wiek), a tym samym o grupie badanej (jedynie ograniczenie czasowe i geografi czne do charakte-rystyki grupy), wynik jedynie w postaci względnej liczby wyszukiwań (RSV) a nie ilościowy, brak 100% powtarzalności wyników wyszukiwań. Jedną z metod, która może pozwolić na zmniejszenie błędu braku powtarzalności jest uśrednienie wy-ników wyszukiwań (te same warunki wyszukania, ale przeprowadzone w różnych

(4)

punktach czasowych np. kilku kolejnych dni). Innym rozwiązaniem jest skorzy-stanie z odpłatnej usługi Google Ads, która w swoich narzędziach posiada planer słów kluczowych dający całkowitą liczbę wyszukiwań hasła lub wyrażenia. Google Ads, podobnie jak GT w swoich opcjach ma prezentację wyników z danego obszaru geografi cznego i wybranego zakresu czasu.

WYKORZYSTANIE GOOGLE TRENDS W PUBLIKACJACH Z ZAKRESU ŻYWIENIA

Przeszukując bazy danych czasopism naukowych odnajdujemy publikacje, w któ-rych wykorzystano GT. Należy zwrócić uwagę, iż „Google Trends” jest nowym hasłem i nie ma go jeszcze w spisie słów kluczowych, co utrudnia identyfi ka-cję prac o tej tematyce. Próba przedstawienia wykorzystania GT w nauce, w tym w naukach żywieniowych, została zrealizowana poprzez przeszukanie m.in. bazy Embase (hasło Google Trends). Otrzymano 369 rekordów z tego około 6% pub-likacji nie dotyczyło wykorzystania GT w medycynie lub naukach o zdrowiu, a 5 publikacji stanowiło opis tego narzędzia. O tematyce związanej z żywnością, żywieniem czy utratą masy ciała było 7 publikacji (hasła ang. weightloss, obesity,

fatreduction, vit. D, gluten free, food allergy).

Jednym z najpopularniejszych zastosowań GT, w naukach żywieniowych jest analiza wyników związanych z redukcją masy ciała, m.in. do przedstawienia da-nych dotyczących takich haseł jak otyłość, otyły czy utrata masy ciała i ich zmian, na przestrzeni lat. Madden (10) wykorzystał GT do analizy danych i opisu zain-teresowań wyszukiwań haseł „utrata masy ciała” oraz „zwiększenie aktywności

fi zycznej”. Zapytania związane z ćwiczeniami były najwyższe w miesiącach

zi-mowych, natomiast te związane z utratą masy ciała wykazywały szczyt zarówno w miesiącach letnich jak i zimowych (10). Poznanie sezonowości zainteresowań wyszukiwaniem haseł związanych ze zdrowiem, pozwala na lepsze planowanie działań z obszaru zdrowia publicznego. W praktyce dietetyka wskazuje się na po-trzebę zwrócenia szczególnej uwagi na te miesiące, w których motywacje, wyrażone poprzez liczbę zapytań w Internecie, są mniejsze, jako krytyczne w procesie opieki nad pacjentem. Jak widać na ryc. 2, słowo „odchudzanie” w Polsce było także naj-częściej wpisywane w wyszukiwarkę Google w 2018 roku, w okolicach Nowego Roku, następnie jego popularność malała aż do okresu Świąt Bożego Narodzenia, po którym znowu nastąpił wzrost popularności. Jest to cykliczny trend obserwo-wany także w innych krajach, wpasowujący się w schemat noworocznych posta-nowień i szybkiej rezygnacji z powodu braku motywacji. Honeybrook i współpr. (11) również wykazali największe zainteresowanie utratą tkanki tłuszczowej wraz z początkiem roku, wskazując na jedną z nieoperacyjnych metod stosowaną do tego celu. W jednym z badań prowadzonych przez Coogan i współpr. (12) przy wykorzystaniu tego narzędzia, sprawdzano wyszukiwanie terminów „utrata masy

ciała”, „dieta” i „gotowość” oraz spożycie składników odżywczych, z danych

ze-branych na poziomie populacji czy mogą być one związane ze zmianami zacho-wań z otyłością. Porównano dane zebrane w GT z wynikami z badań krajowych. Autorzy pracy (12) wskazują, iż dane z wyszukiwarki mogą być wykorzystane do

(5)

badania i przewidywania zachowań żywieniowych na poziomie populacji, co ma wpływ na tworzenie nowych i współczesnych informacji zdrowotnych i strategii marketingowych. Innym zastosowaniem tego narzędzia jest analiza popularności aplikacji na smartphone, pomagających w redukcji i utrzymaniu prawidłowej masy ciała (13).

Cytowany wcześniej Madden (14), wykorzystał również to narzędzie i połączył wyniki z analizy GT dla zapytań dotyczących utraty masy ciała i zwiększenia ak-tywności fi zycznej, w odniesieniu do danych związanych z chorobami układu krą-żenia. Silna sezonowość zapytań dotyczących zwiększenia aktywności fi zycznej wiązała się z niższą częstością występowania cukrzycy (p=0,030), natomiast silna sezonowość poszukiwań haseł związanych z utratą masy ciała nie wykazała żadne-go związku z wynikami badań kardiologicznych (14).

Trzy publikacje wykorzystujące Google Trends, dotyczyły odpowiednio

„alerge-nów w diecie”, „witaminy D” czy „diety bezglutenowej”. Analiza danych, dotycząca

najczęściej wyszukiwanych alergenów, nie pokryła się z danymi epidemiologicz-nym w badaniach Dimov i współpr. (15), jednak ich analiza, co podkreślają autorzy, pozwala dostosować programy edukacyjne do zainteresowań pacjentów. Wyszuki-wanie hasła „witamina D”, także pokazało jego sezonowość, z największą liczbą zapytań w miesiącach zimowych (16). Laszkowska i współpr. (17), dzięki temu narzędziu, wykazali zwiększenie zainteresowania dietą bezglutenową na przestrzeni lat oraz związek z lepszą sytuacją ekonomiczną gospodarstw domowych w zwięk-szonej liczbie zapytań o dietę bezglutenową.

Siuba-Strzelińska oraz Wiśniewska (18) wykorzystały wyniki z GT,

prezentu-jąc wzrost popularności diety ketogennej w ostatnim roku, w odniesieniu do diety śródziemnomorskiej. Wykazano również wzrost zainteresowania wegetarianizmem oraz jeszcze większy weganizmem w ostatnich 5 latach. Podobne materiały były już wcześniej publikowane na stronach Narodowego Centrum Edukacji Żywieniowej, gdzie analizowano popularność wybranych diet w tym m.in. diety Dukana czy diety ketogennej (19).

PODSUMOWANIE

Narzędzie GT daje nowe możliwości dla nauk żywieniowych śledzenia w czasie rzeczywistym popularności informacji, które pojawiają się w Internecie stanowiąc interesujące źródło wspomagające dla naukowców. GT pozwala także na retrospek-tywną wizualizację wyszukiwanych haseł i ich analizę, poprzez eksport w formacie csv oraz na obserwację cykliczności/sezonowości danych. W ocenie GT należy uwzględnić ograniczenia m.in. brak dokładnej metodologii zbierania i porządkowa-nia danych, jak również wyszukiwań ilościowych, czy brak informacji o populacji wyszukującej dane hasło. Liczba informacji i ich szybki przepływ powoduje, iż nauka musi się otworzyć na nowe kierunki pozyskiwania danych, jednak, nie można zapomnieć o ich weryfi kacji zgodnie EBM (ang. Evidence Based Medicine).

(6)

E. B ł a s z c z y k - B ę b e n e k, P. J a g i e l s k i, M. S c h l e g e l - Z a w a d z k a GOOGLE TRENDS CHARACTERISTICS AS A TOOL USING BIG DATA

IN NUTRITION SCIENCE

PIŚMIENNICTWO

1. Oryczkowska M.: Społeczeństwo informacyjne w Polsce w 2018 r. Główny Urząd Statystyczny; 2018. – 2. Walker J. S.: Big Data: a revolution that will transform how we live, work, and think. Int. J. Advert., 2014; 33(1): 181-183. – 3. Gonzalez D.: Big Data – W: Managing Online Risk Apps, Mobile and Social Media Security. Butterworth-Heinemann; 2015; 101-25. – 4. Sciascia S., Radin M.: What can Google and Wikipedia can tell us about a disease? Big Data trends analysis in Systemic Lupus Erythematosus. Int J Med Inf., 2017; 107: 65-69. – 5. Nuti S.V., Wayda B., Ranasinghe I., Wang S., Dreyer R.P., Chen

S.I., Murugiah K.: The Use of Google Trends in Health Care Research: A Systematic Review. PLoS

ONE., 2014; 9(10) https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4215636/. – 6. Cervellin G., Comelli

I., Lippi G.: Is Google Trends a reliable tool for digital epidemiology? Insights from different clinical

settings. J Epidemiol Glob Health., 2017; 7(3): 185-189. – 7. Arora V.S., McKee M., Stuckler D.: Google Trends: Opportunities and limitations in health and health policy research. Health Policy: http://www. sciencedirect.com/science/article/pii/S0168851019300016. – 8. Google: Google News Initiative Training Center. 2019. https://newsinitiative.withgoogle.com/training/. – 9. Google. Google Trends – support. https://support.google.com/trends/answer/6248105?hl=pl&ref_topic=6248052. – 10. Madden K.M.: The seasonal periodicity of healthy contemplations about exercise and weight loss: ecological correlational study. JMIR Public Health Surveill., 2017; 3(4): e92 (doi:10.2196/publichealth.7794).

11. Honeybrook A., Stevens M., Crossing T., Bloom J., Bernstein E., Woodward J.: Non-surgical fat reduction: A social media analysis. Lasers Surg Med. 2018; 50(4): 385. – 12. Coogan S., Sui Z.,

Raubenheimer D.: Gluttony and guilt: monthly trends in internet search query data are comparable

with national-level energy intake and dieting behavior. Palgrave Commun. 2018; 4(1) (doi.org/10.1057/ s41599-017-0055-714). – 13. Wu G., Bautista B.M., Law N., Gao M.: Weight loss apps and diabetes outreach. Endocr Rev., 2017; 38(3 suppl.). – 14. Madden K.M.: Google search data for health promo-tion behaviours and state-by-state cardiovascular risk. Eur Geriatr Med., 2015; c6(1 suppl.): c122-123. – 15. Dimov V., Shahid A., Dimova M.: Designing patient education on food allergy based on patient questions ranked by Google algorithm. Ann Allergy Asthma Immunol. 2015; 115(5 suppl.): 109-110. – 16. Moon R.J., Curtis E.M., Davies J.H., Cooper C., Harvey N.C.: Seasonal variation in Internet searches for vitamin D. Arch Osteoporos., 2017; http://link.springer.com/10.1007/s11657-017-0322-7. – 17. Laszkowska M., Shiwani H., Belluz J., Ludvigsson J.F., Green P.H.R., Sheehan D., Rundle A.,

Lebwohl B.: Socioeconomic vs health-related factors associated with Google searches for Gluten-free

diet. Clin Gastroenterol Hepatol. 2018; 16(2): 295-297. – 18. Siuba-Strzelińska M., Wiśniewska K.: Modne diety – za i przeciw. W: Żywność, żywienie w prewencji i leczeniu – postępy 2018. Otyłość, anoreksja, bulimia – dlaczego wciąż przegrywamy. Warszawa: Instytut Żywności i Żywienia; 2019; s. 57-59. – 19. Wiśniewska K.: Najnowszy ranking diet degradacja diet niskowęglowodanowych. Naro-dowe Centrum Edukacji Żywieniowej. 2018; https://ncez.pl/abc-zywienia-/zasady-zdrowego-zywienia/ najnowszy-ranking-diet-degradacja-diet-niskoweglowodanowych.

Cytaty

Powiązane dokumenty

We measure the unobservable fundamentals (market sentiment) on the basis of Google Trends time series on specific queries searched with the Google engine.. As a benchmark

Pobierz stock_pictures.zip (zlokalizowany w rozpakowanym wcześniej folderze) na dysk twardy, wypakuj zawartość do folderu a następnie prześlij na dysk Google cały folder (do

Wyśrodkuj tekst, użyj czcionki Times New Roman, rozmiar 14, pogrubiona.. Nagłówek powinien być ustawiony jako inny dla pierwszej

Celem przedstawionego badania jest sprawdzenie, czy dołączenie wybranych indeksów Google Trends do autoregresyjnego modelu stopy bezrobocia rejestrowanego poprawia trafność

W trybie desktopowym wystarczy kliknąć w pożądanym miejscu na Mapach Google prawym przyciskiem myszy, a następnie wybrać opcję "Wskazówki dojazdu do.

• Można by tu mówić bardzo wiele – uważam że najistotniejszym czynnikiem jest ten, który pokazuje, że dzięki analizie Google Trends i łączeniu jej z innymi metodami

odwiedzin danej strony (na przykład deltami.edu.pl) stabilizowała się na pewnej granicznej wartości, to byłoby rozsądnie uznać tę wartość za miarę ważności tej strony – im

• Utworzona przez nas mapa domyślnie wyświetla się w trybie zwykłym.. API oferuje dodatkowo jeszcze trzy: mapę satelitarną, mapę hybrydową oraz mapę