• Nie Znaleziono Wyników

Pojęcie Big Data i jego zakres

W dokumencie Przedsiębiorczość i Zarządzanie (Stron 139-144)

Big Data (BD) nie jest terminem jednoznacznym, najczęściej jest tak określany dostatecz-nie duży zbiór różnorodnych zmiennych, które mogą być przetwarzane w różnej kon-figuracji w zależności od celu, jaki chcemy osiągnąć. Poniżej zostaną omówione próby zdefiniowania BD.

139 Pojęcie „Big Data” zostało sformułowane na początku XXI w. przez analityka D. La-ney’ego. BD jest nową technologią operującą, w której zgromadzone są dostatecznie duże zbiory danych mogące być przedmiotem dalszego przetwarzania. Zbiory danych charakteryzują się cechami, takimi jak: duża objętość, różnorodność, zmienność, zło-żoność. Poza tym charakteryzuje je ciągły i nieograniczony napływ poszerzających się strumieni.

Z kolei zdaniem A.M. Wilk Big Data to w istocie „rozproszone masywy różnorodnych cyfrowych informacji dziedzinowych, w  tym również osobowych, obejmujące coraz szersze obszary naszego życia i pracy” [Wilk 2017, s. 129].

Według P. Płoszańskiego wielkie aktualizowane dane pochodzą z różnorodnych źró-deł m.in. z: transakcji kupno – sprzedaż, postów w sieciach społecznościowych, senso-rów meteorologicznych, cyfrowych zdjęć i plików wideo, sygnałów GPS telefonów ko-mórkowych, publicznych baz danych. To wszystko łącznie określane jest jako Big Data [Płoszański 2013, ss. 5–10]. Istotą metodologii Big Data jest przetwarzanie wszystkich ty-pów zbiorów równocześnie.

Zdaniem B. Szafrańskiego BD definiowane jest jako „zbiory danych (informacji) naj-częściej o bardzo dużej objętości, dużej różnorodności i dużej zmienności” [Szafrański 2014, s. 21].

Podczas Forum Teleinformatyki zaś, w toku dyskusji, dochodzi się do wniosku, że BD „to nowa jakość [....] mamy do czynienia z początkiem tworzenia i implementacji nowych metod analizy i eksploracji danych” [Mazurkiewicz 2018].

J. Surma Big Data definiuje jako „aktywa informacyjne charakteryzujące się dużym wolumenem, intensywnym przyrostem w czasie oraz różnorodnością formatów danych, które wymagają adekwatnych metod składowania, przetwarzania i analizowania w celu osiągnięcia określonych celów ekonomicznych, społecznych, politycznych itp.” [Surma 2017, s. 24]. Fenomen Big Data dotyczy składowania danych, użytkowania, korzyści i do-stępności w czasie rzeczywistym.

Pod pojęciem Big Data, według Accenture, rozumie się „zarządzanie ekosystemem wielkich zbiorów danych pochodzących ze zbiorów zewnętrznych, jak i wewnętrznych (np. telematyka)” [https://www.slideshare.net/OptimediaSpain/accenture-four-keys-di-gital-trust, dostęp: 12.09.2018].

Według Meta Group w 2001 r. (obecnie: Gartner) Big Data to „zbiory informacji o du-żej objętości, duo du-żej zmienności i  (lub) duo du-żej różnorodności, które wymagają nowych form przetwarzania w celu wspomagania podejmowania decyzji, odkrywania nowych zjawisk oraz optymalizacji procesów” [Jaworska 2014, ss. 76–79].

Big Data to strumień informacji o zdarzeniach, który w czasie rzeczywistym daje peł-niejszy obraz tego, co się dzieje wewnątrz i na zewnątrz przedsiębiorstwa i dostarcza błyskawicznie potrzebne dane.

140

Big Data odnosi się do zbiorów otrzymanych z Internetu (blogów, portali społeczno-ściowych). Slogan ten wykorzystywany jest często przez dostawców oferujących dane lub możliwość pozyskania określonych danych. Są to dane zewnętrzne, które można po-dzielić m.in. na:

· dane bezpośrednie (bazy demograficzne, dane o szkodowości, adresowe); · słowniki i bazy referencyjne danych osobowych;

· dane pośrednie, np. tablice trwania życia;

· dane mające wpływ bezpośredni na ocenę ryzyka i cenę; · dane długookresowe i krótkookresowe;

· dane rejestrowane w czasie rzeczywistym; · bazy GPS, zdjęcia, mapy, bazy geologiczne; · mapy meteorologiczne;

· cenniki do wyceny pojazdów;

· cenniki do robót budowlano-montażowych [Dyszkiewicz 2015, ss. 34–36]. Dane zawarte w Big Data muszą spełniać następujące warunki:

· powinny być wiarygodne, tzn. nie zawierać w  sobie żadnych błędów – zwłaszcza czujniki przekazujące informacje powinny być atestowane;

· powinny być zróżnicowane w zależności od celu, przedmiotu i miejsca ich zbierania; · powinny być wartościowe, tzn. umożliwiać wykreowanie nowych treści, zależności, korelacji, pozwalających kształtować nową wiedzę.

W Big Data znajdują się dane niewymuszone, niedekleratywne, behawioralne, zasta-ne, niewywołane. Mówi się często o: „szumie informacyjnym”, „nadmiarze informacji”, „zalewie informacji”. Dostawców informacji możemy nazwać „generatorami danych”.

Big Data pozwala na spojrzenie na zbiory danych jakby z lotu ptaka – im wyżej się wznosimy, tym większy obszar danych mamy w polu widzenia.

Big Data to także rozmiar danych. Potocznie mówi się o dużej liczbie danych. Pew-nej próby określenia rozmiaru Big Data dokonali L. Hyunjoung i S. Il, wykorzystując po-miar obecnych wielkości z wykorzystaniem przedrostków, np. peta-, eksa-, zeta bajty itd. [Hyunjoung, Il 2016, ss. 27–28]. W naszym przekonaniu, liczbę danych można wyrazić dowolną liczbą naturalną. Wiadomo, że zbiór liczb naturalnych jest przeliczalny. Na po-trzeby zapisu dużych liczb można je skrótowo oznaczyć, np. 10N w układzie dziesiętnym, gdzie: N – liczba naturalna.

Zdaniem M. Malinowskiej BD można zapisać za pomocą modelu 4 V: · Volume (duża liczba danych) – objętość,

· Variety (dowolny typ danych) – różnorodność, · Velocity – prędkość, dynamiczność danych,

· Value – wartość lub ocena wyrażana w wyniku weryfikacji [Frankowska, Malinowska, Rzeczycki 2017].

141 Stopień implementacji BD uzależniony jest od branży (np. transport, finanse, prze-mysł itp.).

Wraz z terminem „Big Data” pojawia się termin „Big Impact”, czyli „wielki wpływ”, na oznaczenie siły oddziaływania i umiejętności ekstrakcji oraz syntezy prowadzących do uzyskania wartościowych i użytecznych informacji wykorzystywanych do różnych celów.

Rozwój rynku Big Data

W 2011 r. wartość rynku Big Data wyniosła 7,6 mld dolarów, w 2017 r. było to już 33,5 mld, zaś prognoza do 2025 r. zakłada, że będzie ona wtedy na poziomie ok. 92,2 mld dolarów. Z badań Eurostatu wynika, że o ile w Europie 10% przedsiębiorstw wykorzystuje tego typu narzędzia, to w Polsce tylko ok. 6% [Mazurkiewicz 2018].

W projekty BD w USA inwestuje ok. 83% firm przebadanych przez SAS. Z badań wy-nika także, że:

· ok. 56% respondentów zdecydowało się na wykorzystanie tej technologii,

· ok. 40% rozważa zastąpienie obecnych rozwiązań hurtownią danych platformą Ha-doop,

· co piąte przedsiębiorstwo z zakresu machine learning lub sztucznej inteligencji wdro-żyło takie rozwiązania,

· ok. 23% eksperymentowało z uczeniem maszynowym [ttps://www.sas.com/pl_pl/ insights/big-data/what-is-big-data.html, dostęp: 19.09.2018].

W Polsce Centrum Analizy Danych, w ramach globalnego projektu Gamma Boston Consulting Group, otworzyło swój oddział w Warszawie [Mazurkiewicz 2018]. Badania Eurostatu (2016 r.) wykazały, że w Europie średnio 10% przedsiębiorstw wykorzystuje technologie BD, m.in. korzystają z danych z geolokalizacji ok. 45% serwerów społecz-nościowych [Mazurkiewicz 2018]. Podczas Światowego Forum Ekonomicznego w Davos Big Data uznano za nowy, bardzo ważny składnik aktywów firm.

Badania Cisco Connected World Technology przeprowadzone wśród 1800 specjali-stów z IT z 18 krajów, w tym z Polski, pokazują, że:

· ok. 2/3 pytanych potwierdziło, że Big Data będzie strategicznym priorytetem firm w ciągu najbliższych lat;

· najwyższe wyniki w  zakresie wykorzystania BD uzyskały: Argentyna (89%), Chiny (86%), Indie (83%), Polska (78%);

· ponad połowa respondentów (w  tym w  Polsce) uważa, że z  powodu Big Data zwiększy budżety (w  swoich organizacjach) na nowe rozwiązania technologiczne1 1 Jednym z rozwiązań, mających być odpowiedzią na ten problem, jest technologia in-memory computing, w której ładowanie i przetwarzanie informacji odbywa się w pamięci podręcznej RAM, z pominięciem trady-cyjnych nośników danych.

142

[https://www.backupacademy.pl/big-data-duzy-potencjal-duze-wyzwanie/, dostęp: 21.09.2018].

Według badań redakcji „Computerworld” we współpracy z IBM Polska okazało się, że największe wykorzystanie BD odnotowuje się w: branży informatycznej – 42%, prze-myśle (produkcji) – 34%, mediach (reklama) – 37%, telekomunikacji – 25% [Jaślan 2013].

„W sektorze handlu i dystrybucji aż 58% respondentów wykorzystuje bądź planu-je wdrożyć systemy analiz wielkich zbiorów danych głównie dla optymalizacji łańcucha dostaw, profilowania portfolio produktów oraz wspierania kampanii marketingowych” [Jaślan 2013]. To z kolei powoduje zapotrzebowanie na informatyków głównie w celu wykorzystania szans biznesowych w szybko zmieniającym się otoczeniu.

Warto w tym miejscu odnotować obowiązujące akty prawne nawiązujące do BD. W dniu 18 lipca 2002 r. ukazała się ustawa o świadczeniu usług drogą elektroniczną [Dz. U. 2002 Nr 144 poz. 1204 z późn. zm.]. Ustawa określa:

· obowiązki usługodawcy związane ze świadczeniem usług drogą elektroniczną, · zasady wyłączania odpowiedzialności usługodawcy z tytułu świadczenia usług dro-gą elektroniczną,

· zasady ochrony danych osobowych osób fizycznych korzystających z usług świad-czonych drogą elektroniczną.

W ustawie z 18 lipca 2002 r. wprowadza się pojęcie „system teleinformatyczny” , pod którym rozumie się zespół współpracujących ze sobą urządzeń informatycznych i opro-gramowania, zapewniający przetwarzanie, przechowywanie a także wysyłanie oraz od-bieranie, danych poprzez sieci telekomunikacyjne za pomocą właściwych dla danego rodzaju sieci urządzeń końcowych [Ustawa z dnia 18 lipca 2002 r. o świadczeniu usług drogą elektroniczną, Dz. U. 2002 Nr 144, poz. 1204 z poźn. zm.].

W ustawie z 18 lipca 2002 r. przez termin „świadczenie usług drogą elektroniczną” ro-zumie się wykonanie usługi, które następuje w wyniku wysyłania i odbierania danych za pomocą systemów teleinformatycznych na indywidualne żądanie usługobiorcy bez jed-noczesnej obecności stron, przy tym dane te są transmitowane za pośrednictwem sieci publicznych [Ustawa z dnia 18 lipca 2002 r. o świadczeniu usług drogą elektroniczną, Dz. U. 2002 Nr 144, poz. 1204 z poźn. zm.].

W 2005 r. ukazało się Rozporządzenie Rady Ministrów z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych [Dz. U. 2005 Nr 212 poz. 1766 z późn. zm.]. Rozporządzenie określa warunki jakie systemy teleinforma-tyczne powinny spełniać w celu realizacji zadań publicznych. Chodzi o ich wyposażenie a także właściwości i cechy funkcjonalności.

143

W dokumencie Przedsiębiorczość i Zarządzanie (Stron 139-144)