• Nie Znaleziono Wyników

BAZY DANYCH

N/A
N/A
Protected

Academic year: 2021

Share "BAZY DANYCH"

Copied!
11
0
0

Pełen tekst

(1)

BAZY DANYCH

Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk

horzyk@agh.edu.pl Google: Horzyk

HURTOWNIE DANYCH

I BUSINESS INTELLIGENCE

(2)

HURTOWNIE DANYCH

Hurtownia danych (Data Warehouse) to najczęściej konsolidacja danych z różnych systemów IT, zoptymalizowana pod kątem modelowania pewnego wycinka

rzeczywistości. W skład takiej hurtowni wchodzą zbiory danych z różnych źródeł

i są pogrupowane tematycznie, w celu ich wygodnego i zintegrowanego odczytywania, wyszukiwania, analizy, eksploracji oraz wykorzystania do procesów biznesowych,

tj. Business Intelligence.

Hurtownia danych jest wyższym szczeblem abstrakcji niż zwykła relacyjna baza danych, mimo iż tworzone i używane są podobnie, jak również operują SQLem.

Architektura hurtowni danych zorientowana jest na optymalizację szybkości wyszukiwania oraz jak najefektywniejszą analizę

danych, stąd często nie bazują na klasycznym modelu relacyjnych baz danych, które nie są najszybszym rozwiązaniem w tym zakresie.

Najczęściej w praktyce w ramach architektury hurtowni danych można wyróżnić:

Poziom danych detalicznych

Warstwę agregatów, czyli tzw.

kostek tematycznych, np. kostek OLAP.

(3)

OLAP

OLAP (Online Analytical Processing) – to sposób tworzenia analiz i raportów na podstawie danych zbieranych on-line z różnych serwerów i baz danych oraz ich eksploracji

(data mining) pod kątem Business Intelligence.

OLAP to oprogramowanie wspierające proces podejmowania decyzji, które pozwala szybko analizować informacje zawarte w wielowymiarowych widokach i hierarchiach.

Narzędzia OLAP są używane np. do wykonywania analiz statystycznych i badania trendów sprzedaży i przeróżnych analiz finansowych w hurtowniach danych.

Kostki OLAP umożliwiają zwiększenie szybkości dostępu

do danych poprzez definiowanie specjalnych struktur dostępu

do danych.

(4)

KOSTKI OLAP

Kostki OLAP – to struktury danych pozwalające na szybszy dostęp i analizę danych, gdyż dane przechowywane są one w sposób przypominający wielowymiarowe

arkusze kalkulacyjne niż tradycyjną, relacyjną bazę danych.

Dzięki temu posiadają zdolność manipulowania i analizowania danych

z różnych punktów widzenia i wymiarów (atrybutów). Rozmieszczenie danych w kostkach eliminuje część ograniczeń relacyjnych baz danych.

Każda kostka posiada kilka wymiarów i miar , odnoszących się do analizowanych wartości atrybutów. Miary to wskaźniki numeryczne (ile), wymiary reprezentują dane opisowe (kto, co) i mogą być podzielone na poziomy.

Przykład: kostka danych zbudowana dla następujących wymiarów:

towar,

sklep,

czas.

posiada w poszczególnych komórkach kostki informację na temat np. liczby

i wartość sprzedanych sztuk towaru (lub ich grup) w danym sklepie lub sklepach

w zdefiniowanym przedziale czasu. W taki sposób można np. porównywać sprzedaż

w odpowiadających sobie okresach czasu, np. miesiącach.

(5)

KOSTKI OLAP

Kostki OLAP są pewnym rozszerzeniem dwuwymiarowych tabel arkuszy kalkulacyjnych.

Ponieważ w systemie OLAP może być więcej niż trzy wymiary, czasami używa się określenia kostek wielowymiarowych, tzw. hiperkostkek (hypercubes).

PRZYKŁAD: Przedsiębiorstwo może chcieć dokonać analizy danych finansowych

w oparciu o produkt, czas, miasto, według rodzaju dochodu i kosztu oraz poprzez

porównanie rzeczywistych danych z przyjętym budżetem.

(6)

AUTOMATYCZNE RAPORTOWANIE

Automatyczne raportowanie ułatwia i przyspiesza procesy biznesowe.

Automatyczne raportowanie może bazować na kostkach OLAPowych.

Automatyczne raporty tworzą się pod wpływem pewnych zdarzeń zewnętrznych bądź w określonych chwilach czasu.

Takie raporty mogą być wyświetlane w:

kokpitach managerskich,

wysyłane e-mailem,

przedstawiane po zalogowaniu się do systemu uprawnionym pracownikom.

(7)

KOKPITY MANAGERSKIE

Kokpity Managerskie (business intelligence dashboards, corporate performance

management, interactive dashboards) służą do prezentacji, wizualizacji i raportowania danych dla managerów w eleganckiej postaci:

tabel,

wykresów,

podsumowań,

wniosków,

ostrzeżeń (alertów).

Celem stosowania kokpitów menedżerskich jest monitorowanie wydajności organizacji, a więc bieżące udostępnianie informacji odnośnie działań operacyjnych organizacji i potencjalnych odchyleń od wdrożonych strategii działania, planów i procedur.

Ponadto kokpit stanowi narzędzie do wizualizacji danych biznesowych dzięki wykorzystaniu wykresów, grafów oraz map.

(8)

PRZYKŁADY PREZENTACJI DANYCH

W KOKPITACH MANAGERSKICH

(9)

BUSINESS INTELLIGENCE

Business Intelligence (BI) to proces przekształcania danych i ich znalezionych relacji w informacje, a udostępnione informacje umożliwiają formowanie wiedzy o organizacji (biznesie) w celu optymalizacji wewnętrznych procesów przedsiębiorstwa, a poprzez to do zwiększenia konkurencyjności przedsiębiorstwa.

Business Intelligence (BI) polega na kombinacji architektury systemu, aplikacji oraz baz danych w celu przeprowadzenia eksploracji, analiz, raportów, obliczeń i przekształceń w czasie rzeczywistym, dostarczających potrzebnych informacji i wiedzę biznesowej.

Systemy BI generują standardowe raporty lub wyliczą kluczowe wskaźniki efektywności działania przedsiębiorstwa (key performance indicators), na podstawie których

stawiane i weryfikowane są hipotezy. Do tego wykorzystywane są różnego rodzaju narzędzia analityczne, np. OLAP, eksploracja danych.

Business intelligencestanowi narzędzie menedżerów i specjalistów zajmujących się analizami i strategią, którzy oczekują bieżących i aktualnych informacji o stanie przedsiębiorstwa lub aktualnym stanie procesów.

Aby uniknąć konieczności przeglądania gąszczu liczb, wizualizacja stanu aktualnego realizowana jest w postaci graficznej, w postaci wykresów w kokpitach menedżerskich.

(10)

CELE I ZALETY HUTOWNI DANYCH

Cele stosowania hurtowni danych:

agregacja danych i udostępnienie możliwości ich analizy i wnioskowania

przetwarzanie analityczne (OLAP)

archiwizacja danych

analiza efektywności

wspomaganie decyzji (DSS)

wsparcie dla systemów CRM

Zalety stosowania hurtowni danych:

Agregacja danych z różnych źródeł i często niejednorodnych

Analizy obejmujące cały zakres działalności organizacji na podstawie danych zagregowanych

Eksploracja danych wg poziomów agregacji danych

Wprowadzenie jednorodności danych w ramach hurtowni danych

(11)

BAZY DANYCH

I ICH HURTOWNIE

Cytaty

Powiązane dokumenty

Wyszukiwanie SELECT Wstawianie INSERT Aktualizacja UPDATE Usuwanie

• korelacja dodatnia (wartość współczynnika korelacji od 0 do 1) –informuje, że wzrostowi wartości jednej cechy towarzyszy wzrost średnich wartości drugiej

W kroku drugim, na podstawie znalezionych zbiorów częstych są generowane wszystkie reguły asocjacyjne, których ufność jest większa niż zadany próg ufności minconf..

Zajęcia nr 2 Przegląd zbiorów danych z 2 źródeł: MLRepository oraz ArrayExpress Wybór po jednym przykładowym zbiorze do późniejszych analiz z obu zbiorów. Zajęcia nr

Niezależność aplikacji i danych - dane mogą być wprowadzane do bazy bez konieczności modyfikacji korzystających z nich programów czy systemów użytkowych, a z drugiej

Dodaj reguły poprawności wprowadzania danych do poszczególnych pól celem uniemożliwienia wprowadzenia niepoprawnego adresu e- mail, pesela, kodu pocztowego, adresu…..

Następnie stworzyć tabele łącznikowe do powiązania pacjentów i lekarzy oraz pielęgniarki i pokoje relacjami N:M (wiele-do-wielu) 3.. Posortuj następnie tabele wg

• w kierunku środkowej gałęzi, jeśli klucz jest silnie większy od lewej wartości i mniejszy lub równy od prawej wartości klucza.. Dodaj element do liścia w sposób