Perspektywy stosowania big data

W dokumencie 1. Ewolucja rozwoju studiów nad przyszłością (Stron 68-74)

Big data – wielkie perspektywy i wielkie problemy

5. Perspektywy stosowania big data

Szczególnie istotną perspektywą budowania wartości danych jest wykorzystanie informacji powszechnie dostępnych. Na całym świecie powstają różnorodne

inicjaty-28 Zamiana na gotówkę.

29 Tamże, s. 157–159.

30 Tamże, s. 160–162.

Data, która została wsparta przez Baracka Obamę już w pierwszym dniu jego urzę-dowania. 21 stycznia 2009 roku prezydent Stanów Zjednoczonych wydał polecenie udostępnienia takiej ilości danych jak to tylko możliwe przez wszystkie agencje fede-ralne. Określił przy tym, że w przypadku wątpliwości przeważa zasada otwartości.

Podobne aktywności zostały podjęte w Wielkiej Brytanii. Unia Europejska również zapowiedziała działania skoncentrowane na udostępnieniu danych publicznych31. Otwarta wymiana danych przebiega również w sposób nieregulowany, niezależny od decyzji politycznych. Na rysunku 4 przedstawiona jest mapa otwartej wymiany informacji między poszczególnymi podsieciami.

Ryc. 4. Mapa otwartej wymiany danych – Linking Open Data cloud diagram 2014

Źródło: Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/

Analizując dane zamieszczone na rysunku 4, można zauważyć, że istotną część otwar-tej wymiany informacji stanowią publikacje, dane naukowe, ale też różnego rodzaju prze-kaz medialny, z uwzględnieniem treści produkowanych przez media społecznościowe.

Uniprot Health Rank la2010

StatusNet Energy Efficiencynew Builds

DBpedia Deprivation ImdHealth Score 2010 Housing Rank la2010

StatusNetUni Impact IndicatorsApplicationsPlanning Granted Income Rank La2010

WildlifeBBC Education Rank La2010

LOD Working w. tr.Families

ISO 639

Linguistics Linked Datasets as of August 2014

31 Tamże, s. 156.

do nich jest darmowy, a możliwości ich wykorzystania ogranicza jedynie ludzka po-mysłowość oraz względy technologiczne. Open data jest podstawą budowy systemów związanych z geolokalizacją, czego przykładem są mapy z wykorzystaniem GIS (ang.

Geographic Information System) lub ich odmiany np. ortofotomapy. Na tego typu ma-pach oprócz zdjęć satelitarnych terenu można oznaczyć informacje geodezyjne i po-równywać stan rzeczywistego zagospodarowania powierzchni z planowanym. Inną perspektywą zastosowania otwartych danych jest badanie sposobu przemieszczania się osób na poszczególnych ulicach, co może posłużyć do dostosowania oferty pro-duktowej ulokowanych tam sklepów lub szerzej – dostarczyć wniosków, jakiego typu sklepy otworzyć w określonych częściach miasta. Projekty związane z geolokalizacją oprócz efektów pozytywnych mogą wywoływać również pewien sprzeciw społeczny, czego przykładem jest kontrowersyjne przedsięwzięcie Google Street View. Inicjaty-wa ta polegała na fotografoInicjaty-waniu domów, ulic i zapisyInicjaty-waniu danych GPS przy jed-noczesnym odnotowywaniu nazw sieci wi-fi oraz prawdopodobnie na nielegalnym przechwytywaniu informacji z tych niezabezpieczonych. Dane w projekcie zbierane były na zasadzie patrolowania określonych rejonów miast przez specjalny, wyposażo-ny w odpowiednie urządzenia pojazd. Google twierdzi, że informacje były potrzebne do skonstruowania systemu nawigowania bezzałogowych pojazdów32.

Dążąc do pewnego usystematyzowania potencjalnych kierunków związanych z wykorzystaniem analiz big data, na rysunku 5 zaproponowano ich podział ze wzglę-du na wybrane kryteria.

Ryc. 5. Wybrane perspektywy wykorzystania big data Źródło: Opracowanie własne.

32 P. Kirwin, This Car Drives Itself, „Wired UK”, styczeń 2012; wybrane rezultaty projektu można obejrzeć, stosując serwis Street View dostępny w Internecie pod adresem: https://www.google.com/maps/

views/streetview?gl=pl&hl=pl Skala

Stopień komercjalizacji

Specjalizacja

KRYTERIUM

Perspektywy wykorzystania big data

Zastosowania indywidualne Zastosowania globalne

Zastosowania komercyjne Zastosowania niekomercyjne

Zastosowania sektorowe Zastosowania oglne

stosowań, można wyróżnić zastosowania globalne i indywidualne (lokalne) big data.

Pierwsze z nich dotyczą tworzenia wartości powszechnych, ważnych dla całej społecz-ności. Drugie dostarczają wartości istotnych z punktu widzenia danej firmy, instytucji lub nawet osoby. W skali globalnej analiza big data może służyć np. do rozpoznania zachorowalności na danym terenie lub być narzędziem do udowodnienia pewnych ogólnych związków między czynnikami chorobotwórczymi. W drugim przypadku analizy mogą służyć wsparciu podejmowania decyzji strategicznych w przedsiębior-stwie. Podkreślić należy przy tym, że efekty badań indywidualnych mogą dzięki big data zyskiwać skalę globalną. Przykład stanowią niegdyś niedostępne analizy DNA, których koszt w 2012 roku spadł do około tysiąca dolarów w przypadku pojedynczej osoby. Do upowszechnienia tego typu badań przyczyniła się firma 23andMe, która od 2007 roku zajmuje się analizą DNA jej klientów w poszukiwaniu specyficznych cech predysponujących do zachorowalności na nowotwór lub serce. Firma ta jednak działa w skali lokalnej, dysponując tylko pewnymi podzbiorami danych, dotyczących wybranych pacjentów. Jeżeli porównać wyniki badań prowadzonych przez 23andMe z wielką bazą chorych, którym dobierane są leki, można określić pewne podobień-stwa w zakresie reakcji na ich aplikacje. Na podstawie znalezionych korelacji moż-na więc prowadzić terapię w skali globalnej. Steave Jobs, prezes Apple, korzystał ze wskazanej metody, którą nazywał „przeskakiwaniem z kwiatka na kwiatek”, przy czym żartował, że „będzie pierwsza osobą, która w ten sposób pokona raka, albo jedną z ostatnich, która na niego umrze”33.

Drugie kryterium podziału zastosowań big data dotyczy stopnia komercjalizacji.

W ujęciu komercyjnym analiza big data może przyczyniać się do budowania warto-ści biznesowej, czego przykładem są rozmaite systemy ukierunkowane na przewi-dywanie zachowań konsumenckich. Pionierem wdrożenia tego typu rozwiązań jest Amazon, który zrezygnował z zatrudniania osób recenzujących książki, zastępując je rozwiązaniami technologicznymi. Amazon przeprowadził test porównujący wyniki sprzedaży generowane z wykorzystaniem pracy redaktorów z wynikami generowa-nymi przy użyciu analiz big data. Okazało się, że wyniki osiągane bez zaangażowania człowieka są lepsze. Obecnie 1/3 sprzedaży Amazon realizowana jest przez sperso-nalizowany system rekomendacji34.

Wśród głównych komercyjnych perspektywach zastosowań analiz big data wymie-nić można:

 przewidywanie zachowań konsumenckich,

 rekomendowanie produktów (ang. collaborative filtering),

 wspieranie decyzji biznesowych,

 wspieranie działań marketingowych,

 przeciwdziałanie wyłudzeniom czy rezygnacjom klienta z usług,

 analizowanie popytu i podaży.

33 Isaacson W., Steve Jobs, Insignis Media, Kraków, 2011; V. Mayer-Schönberger, K. Cukier, dz. cyt.

34 V. Mayer-Schönberger, K. Cukier, dz. cyt., s. 75.

uważa, największy wpływ w ciągu najbliższych pięciu lat przedstawia rysunek 6.

Ryc. 6. Obszary przedsiębiorstwa na które analizy big data będą miały wpływ w ciągu naj-bliższych pięciu lat.

Źródło: Accenture Big Success with Big Data Survay, 2014.

Z przedstawionych na rysunku 6 danych, będących wynikiem badań przepro-wadzonych przez Accenture w 2014, można wywnioskować, że przedsiębiorstwa w analizach big data upatrują przede wszystkim perspektywę wsparcia działalności biznesowej. Działalność ta dotyczy zmian w obszarze relacji z klientami, lepszego do-pasowania asortymentu do ich wymagań, jak również poprawy organizacji operacji.

Wśród niekomercyjnych zastosowań analiz big data można wskazać te działania, których celem jest rozwiązanie ważnych problemów społecznych, przeciwdziałanie niekorzystnym zjawiskom lub dążenie do zwiększania efektywności funkcjonowania różnych instytucji publicznych. Przykładem tego typu inicjatywy może być opubli-kowanie w czasopiśmie „Nature” w 2009 roku przez inżynierów z Google artyku-łu o możliwościach prognozowania obszarów rozprzestrzeniania się wirusa grypy w Stanach Zjednoczonych z wykorzystaniem analiz big data35. Pomysł polegał na prze-widywaniu ognisk epidemiologicznych na podstawie haseł wpisywanych do przeglą-darki. Porównano informacje wpisywane przez użytkowników z danymi Centrum Zwalczania i Zapobiegania Chorobom w Stanach Zjednoczonych, które zgromadzo-ne były w latach 2003–2008. Na tej podstawie określono 45 fraz, które wykorzystazgromadzo-ne razem w modelu matematycznym dawały dużą korelację między

przewidywania-27%

5%

47%

9%

48%

8%

56%

15%

58%

26%

63%

37%

Koncentracja biznesu na danych

Redefiniowanie produktów

Zmiany sposobu organizacji operacji

Optymalizacja łańcucha dostaw

Fundamentalna zmiana sposobu prowadzenia biznesu Relacje z klientami

Jeden z 3ch głównych czynników wpływu Największy

wpływ

35 Szerzej zob. J. Ginsburg, M. H. Mohebbi, R. S. Patel, L. Brammer, M. S. Smolinski, L. Brilliant, Detecting Influenza Epidemics Search Engine Query Data, „Nature” 2009, nr 457, s. 1012–1014,

http://static.googleusercontent.com/media/research.google.com/pl//archive/papers/detecting-in-fluenza-epidemics.pdf [dostęp: 05.05.2015].

prognozowania ognisk zachorowań36. System ten wykorzystano w 2009 roku, kiedy pojawił się wirus grypy H1N137.

Rozwiązania big data mogą mieć charakter ogólny, który pozwala na ich stoso-wanie w różnych sektorach, lub specjalistyczny, ukierunkowany na daną dziedzinę.

Przykładem pierwszego typu narzędzi jest Apache Hadoop, czyli oprogramowanie służące do przetwarzania dużej ilości danych w rozproszonej strukturze serwero-wej38. Hadoop może być stosowany w sektorze telekomunikacyjnym, energetycznym, medycznym i każdym innym, w którym przetwarzane są duże ilości danych.

Przykładem wyspecjalizowanego podejścia są różnego rodzaju rozwiązania do-stosowane do wspierania działań podejmowanych przez operatorów telekomuni-kacyjnych. Według analityków big data operatorzy telekomunikacyjni posiadają „ko-palnie złota”, które stanowią abonenckie bazy danych. Serwis BigData-MadeSimple.

com wskazuje 11 potencjalnych zastosowań analiz big data, dostosowanych do potrzeb sektora telekomunikacyjnego. Są to w szczególności: rozproszone analizy baz danych, reinżyniering procesów rynkowych, przeciwdziałanie oszustwom, budowanie zwin-nych promocji marketingowych, monetyzacja dazwin-nych o zachowaniach klientów i inne39. Można wskazać wiele przykładów rozwiązań sektorowych charakterystycznych dla big data. Najbardziej predysponowanymi do wykorzystania analiz big data branżami są:

 sektor telekomunikacyjny, ze względu na posiadanie wspomnianych wyżej danych abonenckich i możliwości ich przetworzenia;

 sektor publiczny, ze względu na dużą ilość bieżących i historycznych informa-cji o wielu obszarach funkcjonowania państwa i jego obywateli;

 sektor energetyczny, ze względu na postępujące wdrożenia inteligentnego opomiarowania (ang. smart grid), które prowadzą do powstawania dużej ilości danych o zachowaniach klientów.

 sektor medyczny, ze względu na perspektywę tworzenia rozwiązań mogą-cych na postawie analizy parametrów organizmu ludzkiego, zbieranych przez umieszczone na nim czujniki, przewidywać zagrożenie chorobą oraz liczne perspektywy umożliwiające wykorzystanie dokumentacji medycznej, per-spektywy badawcze itp.;

 sektor finansowy i ubezpieczeniowy, ze względu na dysponowanie dużymi bazami klientów i perspektywę wykorzystania analiz big data do szacowania ryzyka inwestycyjnego, spekulacji opcyjnych oraz możliwości zabezpieczenia przed wyłudzeniami;

36 V. Mayer-Schönberger, K. Cukier, dz. cyt., s. 13–16.

37 A.F. Dugas , Y-H. Hsieh, S. R. Levin, J. M. Pines, D. P. Mareiniss, A. Mohareb, C. A. Gaydos, T. M. Perl, R. E. Rothman, Google Flu Trends: Correlation with Emergency Departament Influenza Rates and Crowding Metrics, „CID Advanced Access”, 8 stycznia 2012.

38 https://hadoop.apache.org [dostęp: 01.05.2015].

39 Szerzej zob. http://www.bigdata-madesimple.com/11-interesting-big-data-case-studies-in-telecom/

[dostęp: 10.05.2015].

danych płynących z systemów geolokacyjnych;

 e-commerce, ze względu na możliwość wykorzystywania narzędzi big data do zarządzania doświadczeniem klienta (ang. Customer Experience Management, CEM).

 sektor sieci handlowych, w którym narzędzia big data można wykorzystać do ustalenia optymalnej lokalizacji sklepów, rozkładu produktów w sklepie oraz doboru asortymentu;

 sektor naukowy, w którym za pomocą analiz big data można poszukiwać kore-lacji między zjawiskami, udowadniać postawione tezy oraz prowadzić bada-nia nieobarczone błędem próby badawczej.

Przedstawione perspektywy pokazują, że zastosowanie analiz big data może przy-nieść wiele korzyści. Jednakże z big data wiążą się również różnego rodzaju problemy.

W celu minimalizacji ryzyka wynikającego z nowych zagrożeń, istotne jest zapozna-nie się z ich charakterystyką.

W dokumencie 1. Ewolucja rozwoju studiów nad przyszłością (Stron 68-74)