Praktyczna i faktyczna mapa Data Science dla Twojej firmy
Listopad 2016
L X V I W i e c z ó r z M a r k e t i n g i e m
2
Co to jest data science?
2016-martech-landscape-supergraphic
https://contently.com/strategist/2016/03/23/insane-supergraphic-3874-
martech-logos-terrify-inspire/
4
Customer Journey
Zakup na stronie WWW
Zakup w POS
Modelowanie sprzedaży Atrybucja kontaktu z touchpointami
Zachowanie na stronie WWW
Zachowanie w POS
CRM: geolokalizacja, historia zakupów i kontaktów, wielkość transakcji, historia kontaktów
Kontakt telefon
Kontakt newsletter Kontakt mail
Wizyta w POS
Kliknięcie w reklamę
Aktywność w social media
Kontakt z przedstawicielem
handlowym
Kontakt przez aplikację mobilną
Wskaźniki globalne – dla bazy danych
• Cost to Acquire a Customer
• Customer Lifetime Value
• Churn
• Wartość bazy danych
CRM
Key Indicators / Kluczowe wskaźniki
Segmentacja, m.in.:
• pod skrypt sprzedażowy
• pod rodzaje komunikacji
Atrybucja osobowa:
• pod dopasowanie ofert i produktów
• pod wagę klienta
• pod dopasownanie komunikatów?
Wskaźniki indywidualne:
• Kupowane kategorie produktów
• Recency
• Frequency
• Monetization
• geolokalizacja
6
Przykład roli danych w marketingu politycznym w USA
ZBIERANIE DANYCH
TARGETOWANIE
KOMUNIKACJI UCZENIE SIĘ
WIECE DOOR2DOOR WOLUNTARIUSZE
TV / PRASA EMAIL DISPLAY
SOCIAL MEDIA - CRM SEARCH
BIG DATA – NA ZWOLENNIKACH
EFEKT:
WIECZNIE OPTYMALIZUJĄCE SIĘ
SKRYPTY
x
Density
gausers
0 20 40 60 80
0.032 0.13
*
0 500 1000
0.11
*
050100150200
-0.038
020406080
x
Density
gtrends
0.04 -0.45
***
-0.03
x
Density
socialmedia
-0.025
50150250350
-0.15
**
05001000
x
Density
newsletter
-0.13
*
0 50 100 150 200 50 150 250 350 0.0 0.4 0.8
0.00.40.8
Density
income
Data Insights na przykładzie IRCenter
8
Telewizja i video – wskaźniki do modelowania
Marketing internetowy
Co to jest tak naprawdę programmatic - ekosystem działań display i cookiesów
reklamodawca
Demand siteDSP platforms – to mówi, jakie chce
cookiesy
Adexchange / RTB
Sell/supplySSP demand
platform
Wydawcy
Wszystkie informacje jakie tylko chcemy – o zachowaniach cookies’ów
10
Cookies
(tak naprawdę chodzi o maile) Chyba, że kampania w założeniu ma zasięg
liczony w milionach
Hurtownie danych,
map reduce, płaskie
bazy danych
12
Czy to A czy B?
Algorytmy klasyfikacyjne
Mainstreamowe rozwiązania i techniki 1/2
Czy to dziwne i powinienem na to zwrócić uwagę?
Detekcja anomalii
Jak dużo / jak wiele?
Regresja
Mainstreamowe rozwiązania i techniki 2/2
W jaki sposób to się dzieli Algorytmy klastrujące
Co mam zrobić?
Algorytmy predykcyjne (przewidujące)
Sztuczna inteligencja (sieci neuronowe, shallow learning i deep learning) Analiza obrazu, dźwięku, video, języka
GIS – mapy i obszary
14
Excel i MySQL nie są złe
Najbardziej znane ekosystemy data-science
16
Software do data mining
Data management platforms
18
Standardowe connectory do
Data Management Platforms
Markety danych
20
A najlepsze ekosystemy to rządowe bazy danych
• Elektroniczne księgi wieczyste
• Krajowy Rejestr Sądowy wraz z historią zmian w spółkach od 2001 roku
• Centralna Ewidencja i Informacja o Działalności Gospodarczej
• Giełda Papierów Wartościowych
• Rejestry przetargów odbywających się w Polsce i Europie wraz z przetargami
prywatnymi
• Rejestr REGON
• Rejestr UOKIK
• Dane z Komisji Nadzoru Finansowego:
• Notowania spółek na giełdach finansowych
• Pełne dane geograficzne Polski wraz z danymi katastralnymi i działkami
• Dane z publicznych giełd długów
• Dane teleadresowe BIP (dane ściągane ze wszystkich BIPów) – informacje o podmiotach i organizacjach działalności
państwowej
• Rejestry medyczne
• Rejestry zawodowe:
PKD - Największy wzrost względem dwóch ostatnich lat
46.42.Z- Sprzedaż hurtowa odzieży i obuwia;
49.31.Z- Działalność taksówek osobowych;
82.11.Z- Działalność usługowa związana z administracyjną obsługą biura;
96.02.Z - Fryzjerstwo i pozostałe zabiegi kosmetyczne;
96.09.Z- Pozostała działalność usługowa, gdzie indziej niesklasyfikowana (w której skład wchodzą: działalność astrologiczną i spirytystyczną,
działalność biur towarzyskich, biur matrymonialnych, działalność agencji hostess, działalność salonów tatuażu i piercingu, dorabianie kluczy i inne).
22
Przykład analiz na bazie PKD i Google
0 200 400 600 800 1000 1200 1400
0 50 100 150 200 250
2 0 1 4 -0 7 -0 1 2 0 1 4 -0 8 -0 1 2 0 1 4 -0 9 -0 1 2 0 1 4 -1 0 -0 1 2 0 1 4 -1 1 -0 1 2 0 1 4 -1 2 -0 1 2 0 1 5 -0 1 -0 1 2 0 1 5 -0 2 -0 1 2 0 1 5 -0 3 -0 1 2 0 1 5 -0 4 -0 1 2 0 1 5 -0 5 -0 1 2 0 1 5 -0 6 -0 1 2 0 1 5 -0 7 -0 1 2 0 1 5 -0 8 -0 1 2 0 1 5 -0 9 -0 1 2 0 1 5 -1 0 -0 1 2 0 1 5 -1 1 -0 1 2 0 1 5 -1 2 -0 1 2 0 1 6 -0 1 -0 1 2 0 1 6 -0 2 -0 1 2 0 1 6 -0 3 -0 1 2 0 1 6 -0 4 -0 1 2 0 1 6 -0 5 -0 1 2 0 1 6 -0 6 -0 1 w ys zukiw an ie hasła "pr ogr amo w an ie dl a d zi ec i"
prz yr os t li czb y spółek z 6 2 .0 1 .Z
Przyrost liczby spółek zajmujących się oprogramowaniem i najbardziej skorelowane z nim hasło wyszukiwane w Google
przyrost liczby spółek z 62.01.Z
wyszukiwanie hasła "programowanie dla dzieci"
Tłumaczenie sondaży politycznych aktywnością w social media
0 5 10 15 20 25 30 35 40 45
Sondaże - PiS Sondaże - PO Sondaże - Nowoczesna
google_ SLD 0,06
google_ schetyna 0,03
google_ po 0,02
socialmedia_ petru 0,00
socialmedia_ razem 0,00
socialmedia_ psl 0,00
socialmedia_ po 0,00
socialmedia_ n 0,00
google_ zl -0,04
google_ macierewicz -0,04
google_ morawiecki -0,04
google_ korwin -0,05
google_ zandberg -0,06
24
Google Analytics Suite 360
Analytics 360 Tag Manager Optimize 360
Attribution 360 Audience Center 360 Data studio
Ekosystem danych Google
26
Magic Quadrant 2015 for Digital Marketing Analytics
https://www.gartner.com/doc/reprints?id=1-2OHWYQP&ct=151001&st=sb
Microsoft
STREAM ANALYTICS
28
IBM Whatson Analytics stawia na przewidywanie
Deep learning i Tensorflow Google – sieci neuronowe
Z a p r a s z a m y d o w s p ó ł p r a c y
Interactive Research Center Spółka z o.o., ul. Rakowiecka 34/13, 02-532 Warszawa
NIP: 1132743365, KRS: 0000315719, REGON: 141534583, rok założenia: 2008, kapitał zakładowy: 105 000,00 PLN