• Nie Znaleziono Wyników

Projektowanie hurtowni danych z wykorzystaniem pakietu Pentaho Business Intelligence

N/A
N/A
Protected

Academic year: 2022

Share "Projektowanie hurtowni danych z wykorzystaniem pakietu Pentaho Business Intelligence"

Copied!
5
0
0

Pełen tekst

(1)

- -

- -

- - - - - -

-

SZKOLENIE ŚREDNIO ZAAWANSOWANE

Projektowanie hurtowni danych z wykorzystaniem pakietu Pentaho Business Intelligence

PENTAHO/DW

Czas trwania: 5 dni

Cele szkolenia

...

...

Zdobycie przekrojowej wiedzy dotyczącej projektowania, implementowania, monitorowania, uruchamiania, strojenia procesów i elementów hurtowni danych

Poznanie ogólnych założeń hurtowni danych tj. najpopularniejsze schematy relacyjnych hurtowni danych

Wybór właściwego zestawu narzędzi i technik dla swoich projektów

Skupienie się na stosie produktowym wybudowanym wokół Pentaho Business Intelligence Suite

Zalety

...

...

Program obejmuje zarówno ogólne wprowadzenie w tematykę ETL, DWH, OLAP, jak i całościowe przedstawienie stosu produktowego Pentaho Business Intelligence

Szkolenie jest unikalne, gdyż tematyka poruszana w jego trakcie nie jest wyczerpująco ujęta w dostępnej literaturze, a wiedza na ten temat jest mocno rozproszona

Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, których dotyczy szkolenie

Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Dla kogo?

...

...

Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać hurtownie danych (DWH) z wykorzystaniem Pentaho Business

(2)

-

Wymagania

...

...

Od uczestników wymagana jest podstawowa znajomość baz danych, podstawowa umiejętność programowania w języku Java

(3)

1.

a.

b.

c.

d.

e.

f.

g.

h.

2.

a.

b.

c.

d.

e.

f.

g.

h.

i.

3.

a.

- - - - - - - - b.

- - c.

- - - - - - -

-

Program

...

...

Wprowadzenie do hurtowni danych i platformy Pentaho BI Suite OLTP, OLAP, bazy danych, hurtownie danych, data marty ROLAP, MOLAP, HOLAP

Normalizacja, agregacja, fakty, wymiary SQL, MDX, XML/A

ETL i integracja offline

BigData, BigTable, NoSQL, nierelacyjne hurtownie danych Architektura i składowe Pentaho BI Suite

Business intelligence a hurtownie danych Fizyczne struktury danych w hurtowni danych

Tabele faktów i tabele wymiarów

Indeksy, widoki, widoki zmaterializowane

ROLAP w szczegółach: schemat gwiazdy, płatka śniegu, konstelacji faktów Testy wydajności ROLAP: The TPC Benchmark H

ROLAP vs MOLAP

Metody optymalizacji szczególnie przydatne w przypadku hurtowni danych Wykorzystanie Pentaho Aggregate Designer do optymalizacji hurtowni danych Znaczenie wymiaru czasu w hurtowniach danych

Dziedzinowe hurtownie danych a dedykowane struktury danych np.: GeoSpatial DWH Zasilanie hurtowni danych z wykorzystaniem Pentaho Data Integration (PDI)

ETL

Ekstrakcja danych

Transformacja, oczyszczenie i uzupełnianie danych Ładowanie

Wyznaczniki i ocena jakości danych Staging

Hurtownie czasu rzeczywistego

Kwestie wydajnościowe w kontekście procesów ETL Przegląd narzędzi ETL dostępnych na rynku

Pentaho Data Integration Architektura

Składowe Praca ze Spoon

Instalacja, uruchomienie, Look & Feel (perspektywy, zakładki etc.) Zmienne

Hopy

Praca z repozytorium i plikami XML

Współdzielenie obiektów tj. połączenia z bazami danych, partycje, klastry Czytanie i zapisywanie danych z różnych źródeł danych

Transformacje

Walidacja danych

(4)

- - - - - - - -

- - - - - - - d.

- - - - e.

4.

a.

b.

c.

- - - - - - - d.

e.

f.

5.

a.

- - - - - b.

Uzupełnianie danych Transformacja danych Optymalizacja

Wykorzystanie własnego kodu w transformatach Utlilities

Monitorowanie wydajności i analiza logów Wersjonowanie i praca grupowa

Zadania

Zadania (kjb) a transformacje (ktr) Tworzenie złożonych zadań

Wykorzystanie własnego kodu w zadaniach Przepływ pracy

Praca z plikami

Monitorowanie wydajności i analiza logów Wersjonowanie i praca grupowa

Praca z Kitchen i Pan

Uruchamianie zadań i transformat z plików i z repozytorium Scheduling

Obsługa błędów

Przekierowanie wejścia/wyjścia Praca z Cartle

Analityka z wykorzystaniem OLAP oraz Pentaho Analysis Services (Mondian) Definiowanie kostek OLAP na hurtowni danych

Pentaho Schema Workbench (PSW) Model logiczny i model fizyczny

Kostki Miary

Wymiary, hierarchie, levele Tabele

Relacje Agregaty Wyrażenia

MDX w szczegółach

Operacje Slice, Dice, Drill na kostkach Optymalizacja na potrzeby OLAP

Raportowanie danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Report Designer (PRD)

Definiowanie raportów za pomocą PRD Źródła danych

Modelowanie zapytań Wydobywanie danych

Zawężanie i filtrowanie wyników Wizualizacja danych na raporcie Osadzanie raportów

(5)

c.

d.

6.

a.

b.

c.

d.

7.

a.

- - - - - b.

8.

a.

b.

c.

- - - - - - - d.

- - - - - e.

f.

9.

Eksport do PDF, HTML, RTF etc.

Report Wizard

Raportowanie i analiza ad-hoc

Pentaho BI Platform/Portal (BA Platform) Pentaho Interactive Reporting (PIR) Pentaho Metadata Editor (PME) Pentaho Analyzer (PAZ)

Kokpity i dashboardy managerskie na danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Dashboard Designer (PDD)

Definiowanie dashboardów za pomocą PDD

Praca z wykresami - simple bar, line, area, pie, dial charts Praca z tabelami

Praca z raportami Parametry

Szablony

Osadzanie dashboardów

Eksploracja danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Data Mining (WEKA)

Architektura

Praca z Explorerem

Preprocessing i praca z danymi Format danych ARFF

Przygotowanie danych do analizy

Odpowiedni dobór atrybutów np.: korelacja atrybutów a wyniki eksploracji danych etc.

Filtrowanie i rodzaje filtrów w WEKA np.: filtrowanie, dyskretyzacja, normalizacja etc.

Wizualizacja

Przetwarzanie dużych zbiorów danych, ograniczenia JVM 32bit Przetwarzanie strumieni oraz uczenie przyrostowe

Eksploracja danych Klasyfikacja Grupowanie

Odkrywanie reguł asocjacyjnych

Ograniczanie i transformacja przestrzeni atrybutów

Pozostałe algorytmy i techniki eksploracji danych dostępne w WEKA Rozbudowa możliwości WEKA

Wykorzystanie możliwości w połączeniu z innymi produktami Pentaho Pentaho Mobile BI

Cytaty

Powiązane dokumenty

• Architektura warstwowa: fizyczna hurtownia centralna, kolejne warstwy fizycznych hurtowni tematycznych... ARCHITEKTURA

Najczęściej wykonywane operacje OLAP - terminologia:.

- toute fonction mesurable (ayant la propriete de Baire)[raesu- rable et avec la propriete de Baire] est la somme de deux fon­ ctions et la limite de certaine suitę de

Reasumując, naleŜy stwierdzić, ze istotnym problemem polskiej nauki i gospodarki jest zbyt mała współpraca, co przekłada się na stosunkowo małą liczbę

Po- wiązanie z kryterium epistemicznym nie będzie może w tym wypadku tak niekontrowersyjne, niemniej jednak wydaje się, że to właśnie zapewnienie jak najszerszej przestrzeni

Our findings showed that erector spinae muscle force was significantly larger in the back squat condition when compared to the front squat.. It is likely that this finding relates

Warto w tym miejscu odwołać się do Katechizmu Kościoła katolickiego, który stwierdza, że: „nauka i technika są cennymi bogactwami, gdyż służą człowiekowi i jego

Jak widać z układu rozdziałów, cały wysiłek tego obszernego i pracowitego' studium zmierza, poprzez porównawczo-typologiczne badania, do opisu trzech