• Nie Znaleziono Wyników

Data mining w badaniach rynkowych i marketingowych - obszary zastosowań

N/A
N/A
Protected

Academic year: 2021

Share "Data mining w badaniach rynkowych i marketingowych - obszary zastosowań"

Copied!
7
0
0

Pełen tekst

(1)

M ariu sz Ł a p czyń sk i*

DATA M IN IN G W BADANIACH RYNKOW YCH I M A R K ETIN G O W Y CH - OBSZA RY ZA STO SO W A Ń

1. Wprowadzenie

D ata m ining to zestaw narzędzi analitycznych1 (m.in.: sieci neuronowych, drzew klasyfikacyjnych i regresyjnych, reguł skojarzeniowych), które pozwalają tworzyć m odele deskryptywne i predykcyjne. Te pierwsze pozwalają poznać badane zjawisko za pom ocą zestawu reguł, natom iast te drugie umożliwiają budowę prognoz. Termin „data mining” jest kojarzony z terminem „database m arketing” (m arketing oparty na bazach danych). Jak o etap procesu odkryw ania wiedzy w bazach danych m a z nimi wiele wspólnego. To właśnie ilość gromadzonych danych i m oc obliczeniowa kom puterów przy-czyniły się do rozkw itu tej dziedziny na początku lat 90. ubiegłego stulecia. Ścisły związek z bazami danych nie oznacza jednak, że narzędzia d ata mining m ają być stosowane wyłącznie do terabajtów informaq'i w hurtowniach danych. Z powodzeniem zastępują klasyczne statystyczne m etody analizy danych ankietowych, gdzie zbiór obserwacji liczy z reguły mniej niż 2 tys. przypadków.

2. Obszary zastosowań data mining

D ata m ining znajduje zastosowanie w analizie2 rentowności klienta, w badaniach związanych z pozyskaniem nowych nabywców, w analizie

* M g r, K a te d r a A n alizy R y n k u i B a d a ń M ark etin g o w y c h , A k a d e m ia E k o n o m ic z n a w K rak o w ie.

1 M . Ł apczyński, W prowadzenie do data mining, „Z eszyty N a u k o w e A E w K ra k o w ie ” (w d ru k u ).

(2)

sprzedaży krzyżow ej, w badaniu przyczyn nielojalności konsum entów , w badaniach segmentacyjnych, w analizie koszykowej, a nawet w analizie danych kwestionariuszowych.

2.1. Analiza rentowności klienta (customer profitability)

Podstawowym obszarem zastosowań data mining w praktyce jest analiza rentow ności klientów. Jej zdefiniowanie jest punktem wyjścia budow y m odelu predykcyjnego. Rentowność może być rozum iana jak o w artość współczynnika ROI lub jak o wartość życiowa klienta. Ponieważ jej wysokość zm ienia się w m iarę upływu czasu, istnieje konieczność stałej analizy kontaktów klienta z firmą i wielkości sprzedaży z każdej transakcji. To powoduje, że zamiast o CRM mówi się czasami o CPM (Custom er Profi-tability M anagem ent)3.

N arzędzia d ata mining pozwalają odkryć wzorce i profile konsum entów , na podstawie których menedżerowie są w stanie przewidzieć ich rentowność. Trzeba tylko precyzyjnie zdefiniować zmienną zależną, która w najprostszej postaci może być różnicą między przychodem ze sprzedaży a kosztami produkcji, sprzedaży, obsługi i m arketingu. W sytuacji gdy bieżąca i poten-cjalna wartość klienta są jednakow e, dąży się do minimalizacji kosztów związanych z utrzymaniem sprzedaży na dotychczasowym poziomie. Jeśli z kolei potencjalna wartość klienta jest wyższa od obecnej, to poszukuje się informacji o tym, jak najtaniej spowodować przejście klienta do bardziej dochodowej grupy.

Analizując dane, trzeba zwrócić uwagę na to, by mierzyć wzrost ren-towności klienta. Czasem może to być wskaźnik trudny do oszacowania, niemniej jednak jest to najlepsza m iara oceniająca skuteczność akcji promocyj-nej w m arketingu bezpośrednim. N arastająca rentowność klienta (incremental

customer profitability) to różnica zysku i kosztów promocji. Zysk jest tu

traktow any jako przyrost zysku spowodowany akcją promocyjną.

2.2. Pozyskiwanie klientów (customer acquisition)

D otychczasow e podejście do pozyskiw ania klientów opierało się na kombinacji marketingu masowego i marketingu bezpośredniego. W marketingu masowym wykorzystywano m.in. reklamę w mediach lub reklamę zewnętrzną. Odpowiednie nośniki reklamy dobierano tak, aby profil słuchacza czy widza

3 A . B erso n , S. S m ith , K.. T h ea rlin g , B uilding D a ta M in in g A pp lica tio n s f o r C R M , M c G ra w -H ill, U S A 2000.

(3)

był zgodny z charakterystyką dotychczasowych klientów firmy. W m arketingu bezpośrednim używ ano takich technik, ja k telem arketing czy reklam a pocztowa. Z bazy danych wybierano te osoby, które spełniały określone kryteria demograficzne. W raz ze wzrostem liczby cech i, przede wszystkim, objętości baz danych, konieczne było budowanie modeli predykcyjnych. Były to m odele statystyczne i w przypadku dużych zbiorów obserwacji m odele d ata mining.

K orzystając z narzędzi d ata mining, należy odpowiednio zakodow ać zm ienną zależną, którą w tym przypadku jest reakcja odbiorcy na przekaz reklamowy. Jeśli jest to reakcja typu „tak-nie” („kupi-nie kupi” ), to stosuje się kod binarny. Jeśli reakcja jest wielowariantowa, to zmienna zależna jest w ielokategorialna. K ategoria m oże oznaczać rodzaj nabytego produktu, jego m arkę lub przedział cenowy, w jakim się znajduje. Liczba i rodzaj kategorii zależy od problem u badawczego. Ogólnie rzecz biorąc, istnieją 3 możliwe pozytywne reakcje na ofertę kupna:

a) zapytanie o produkt - klient stara się dowiedzieć czegoś więcej o ofercie firmy, pyta o szczegóły dotyczące ceny, koloru, m odelu itp.;

b) zakup produktu - to klasyczny sukces, klient reaguje zakupem , wybiera z oferty reklam owany produkt;

c) zakup innego produktu - klient wybiera z oferty firmy produkt inny, niż reklamowany.

Jeśli chodzi o reakcje negatywne, to rozróżnia się 2 jej rodzaje:

a) klient nie odpow iada na ofertę - b rak odpowiedzi nie oznacza odm ow y, gdyż m oże być spow odow any np. nieobecnością klienta lub nieotrzym aniem oferty;

b) odm owa - to klasyczne niepowodzenie, z badawczego punktu widzenia inform acje o osobach nie zainteresow anych ofertą przedsiębiorstw a są równie cenne, pozwalają stworzyć profil takiej osoby i usprawnić ewentualne przyszłe działania m arketingowe.

2.3. Sprzedaż krzyżowa (cross-selling)

Innym obszarem, w którym znajdują zastosowanie modele d a ta mining, jest sprzedaż krzyżowa. Interakcje między przedsiębiorstwem a klientam i są dynamiczne, a zadanie m arketerów polega na optymalizacji tej współpracy. M ożna jej dokonać na 3 sposoby:

- poprzez wydłużenie czasu współpracy;

- poprzez zwiększenie liczby transakcji w czasie trw ania współpracy; - poprzez zwiększenie zysku firmy w kolejnych transakcjach.

Sprzedaż krzyżowa (cross-selling) polega na oferowaniu dotychczasowym klientom nowych produktów lub usług. Przykładowo: nabywcom pieluch

(4)

proponuje się po pewnym czasie zakup rowerków dziecięcych. Choć ten przykład jest bardzo prosty, to w rzeczywistości narzędzia d ata m ining pozwalają na znalezienie bardziej wyszukanych wzorców zakupów. Jedną z odm ian sprzedaży krzyżowej jest sprzedaż uzupełniająca (up-selling), która polega na tym, że dodatkow e p rodukty lub usługi są ściśle związane z produktem (usługą) aktualnie użytkowanym przez konsum enta. Przykładem jest sprzedaż droższego pakietu dla abonenta, który jest już podłączony do

sieci telefonicznej.

Przed przystąpieniem do budowy m odelu predykcyjnego d ata mining należy sprecyzować, co będzie stanow ić d odatkow ą ofertę dla klienta. Kolejny krok to zebranie zbioru danych, którym zazwyczaj jest istniejąca w przedsiębiorstwie hurtow nia danych. Analizie poddaw ane są przeszłe transakcje. Proces analizy sprzedaży krzyżowej jest trzyetapowy:

1. M odelow anie zachowań indywidualnych klientów (dla każdej d o d a t-kowej oferty buduje się osobny model predykcyjny).

2. N adaw anie ocen klientom (w najprostszej postaci chodzi o praw dopodobieństw o pozytywnej reakcji na dodatkow ą ofertę firmy) i k o n -struow anie macierzy ocen.

3. optymalizacja macierzy ocen - może być dokonana 4 m etodam i: a) naiw ną (naive) - opartą na praw dopodobieństwie zakupu,

b) średnią ekonom iczną (average economic) - opartą na średnim zysku z transakcji,

c) zindywidualizowaną ekonomiczną (individual economic) — poszerzoną o dodatkow e informacje finansowe o kliencie,

d) ograniczoną (constraint optimization) - zawierającą dodatkow e ze-wnętrzne ograniczenia, np. m aksym alną liczbą ofert na segment (region); wprowadzenie tych ograniczeń powoduje, że oszacowany zysk przedsiębiorstwa będzie mniejszy lub równy zyskowi oszacowanemu innymi m etodam i.

2.4. Badania przyczyn nielojalności klientów (churn analysis)

Term in „churn” jest stosowany w branży telekomunikacyjnej i oznacza odejście klientów do konkurencyjnych operatorów sieci kom órkow ych. W praktyce może oznaczać utratę klientów na rzecz konkurencji w dowolnej branży. Istnieją dwa podejścia do szacowania wskaźnika odejścia4. Pierwsze opiera się na m etodzie R F M (recency, frequency, monetary), która w dużym skrócie polega na zbadaniu, kiedy ostatnio dokonano zakupu (recency), z jak ą częstotliwością dokonyw ano zakupów w badanym okresie (frequency)

4 M . A. P. M . L ejeune, M easuring the im pact o f data m ining on churn m anagem ent, „ In te rn e t R esearch : E lectro n ic N e tw o rk in g A p p lica tio n s and Policy” 2001, V ol. 11, N o . 5.

(5)

i jak a była wartość poszczególnych zakupów (monetary). Analizuje się tu wskaźnik recency, który jest tożsam y ze wskaźnikiem odejścia. Przykładowa reguła m oże brzmieć: „jeśli klient dokonał zakupu w ciągu ostatnich 8 miesięcy, to uznaje się go za klienta aktyw nego” . T o uogólnienie m a tę wadę, że na różnych rynkach i w różnych segmentach inna m oże być częstotliwość zakupu.

D rugie podejście to m etoda VAL (value, activity, loyalty), w ktorej szacuje się indywidualne zachowanie klienta na podstawie większej liczby przypadków . O ile w pierwszej m etodzie o wysokości wskaźnika odejścia dla pojedynczego klienta decydował wskaźnik recency dla tej konkretnej osoby, o tyle w drugiej m etodzie wskaźnik odejścia szacowany jest z większej liczby przypadków (np. danego segmentu).

Zadanie d ata mining polega na predykcji klientów nielojalnych i pośrednio na oszczędności kosztów związanych z pozyskaniem nowych. Najlepszym narzędziem do badania przyczyn nielojalności klientów są drzewa klasyfikacyj-ne, mimo że równie skuteczne w budowie prognoz są sztuczne sieci neuronowe. A tutem drzew jest ich czytelny i łatwy w interpretacji m odel graficzny. Narzędzie to pozwala na podejście deskryptywno-predykcyjne.

2.5. Badania scgmentacyjne

Segmentacja i selektywność rynku to kolejny obszar zastosow ań narzędzi d a ta mining. Przykładowo, drzewa klasyfikacyjne i regresyjne pozwalają analizować zmienne ilościowe i jakościowe. Zwłaszcza te drugie dość często występują w badaniach segmentacyjnych. Identyfikuje się homogeniczne grupy konsum entów na podstawie ich stosunku do m arek produktów lub innych instrum entów marketingowego oddziaływania. Coraz popularniejsza staje się segmentacja psychograficzna konsumentów. T o właśnie niemierzalny charakter zmiennych opisujących segmenty i niemierzalne cechy produktów w badaniach selektywności powodują, że coraz częściej do profilow ania segmentów używa się narzędzi data mining.

2.6. Analiza koszykowa (market basket analysis)

A naliza koszykowa opisuje transakcje dokonywane przez klientów super-m arketów za posuper-m ocą reguł skojarzeniowych (association rules). Reguła skojarzeniowa przyjmuje postać: J e ś li zdanie Z,, to zdanie Z2” np. „jeśli kupił produkt A, to kupił produkt B". Z form alnego p u nktu widzenia jest to zdanie warunkowe, w którym produkt A jest poprzednikiem , a produkt

(6)

i ilościowe. W przypadku tych pierwszych uzyskuje się inform acje o tym, jaki produkt z następnika został kupiony razem z produktem z poprzednika. Co do ilościowych reguł skojarzeniowych, to poza inform acją na tem at rodzaju produktu, uzyskuje się informację o nabytej ich liczbie np. „jeśli kupił 2 kg produktu A , to kupił 3 sztuki produktu B". Istnieją też inne podziały reguł skojarzeniowych:

- n a jednowym iarowe (zawierające jeden poprzednik) i wielowymiarowe (zawierające kilka poprzedników np. ,jeśli kupił produkt A i pro d u k t C, to kupił produkt B ”),

- na jednopoziomowe i wielopoziomowe (zawierające bardziej szczegółowe

inform acje o nabytych produktach np. „jeśli kupił p ro d u k t A m arki Z w opakow aniu 0,5 1, to kupił produkt В m arki Y ” ).

A naliza koszykowa znajduje uznanie u specjalistów ds. m erchandisingu (pozwala n a efektywne rozmieszczenie asortymentu), specjalistów ds. promocji (wiedzą, jakie produkty powinny być prom ow ane razem) i specjalistów ds. logistyki (przewidzą, jak braki w zaopatrzeniu jednych produktów wywołują spadek sprzedaży innych).

2.7. Analiza danych kwestionariuszowych

A lternatyw ą dla tabel kontyngencji, często stosowanych w badaniach kwestionariuszowych, jest jeden z algorytmów drzew klasyfikacyjnych - CHA- I D 5. T u również wykorzystuje się test niezależności chikw adrat, a a u to -m atyzacja obliczeń znacznie przyspiesza analizę zbiorów obserwacji z wielo-ma zmiennymi. C H A ID nie mierzy dokładnie siły związku między zmiennymi, nie m ożna porównywać rankingu ważności predyktorów z wartościam i współczynnika V Cram era. CH A ID jest natom iast bardziej przejrzysty, pozwala dokonać profilu kategorii zmiennej zależnej za pom ocą zestawu reguł o postaci „jeżeli... to...” , a nie jak w przypadku analizy tabelarycznej za pom ocą nieczytelnej tabeli o bardzo dużych rozm iarach.

3. Podsumowanie

Gw ałtowny rozwój inform atyki na początku lat 90. przyczynił się do popularyzacji dziedziny zwanej d ata mining. D uża elastyczność narzędzi analitycznych przejawiająca się możliwością analizy zmiennych wyrażonych

5 M . Ł ap czy ń sk i, A naliza porów naw cza label ko ntyngencji i m eto d y C H A ID , „Z eszyty N a u k o w e A E w K ra k o w ie ” (w d ru k u ).

(7)

na różnych poziom ach pom iaru spowodowała, że szybko znalazły się one w kręgu zainteresowań badaczy marketingowych. Zaczęto je wykorzystywać nie tylko w m arketingu opartym na bazach danych, ale również w analizie mniejszych zbiorów przypadków. Przedstawione w tym artykule obszary zastosowań d ata m ining są tylko krótkim wprowadzeniem w tę interdys-cyplinarną dziedzinę.

M a riu sz Ł a p czyń ski

D A T A M IN IN G A P P L IC A T IO N S IN M A R K E T IN G R E S E A R C H

T h e p u rp o se o f th is article is to describe d a ta m in in g ap p lic atio n s in m a rk e tin g research. T h e a u th o r outlin ed sh o rtly m ain C R M areas: cu sto m er acq u isitio n , cu sto m e r p ro fita b ility , c h u m analysis an d cross-selling. H e also focused on seg m en tatio n research , m a rk e t b ask et an aly sis a n d analysis o f q u e stio n n a ire d a ta w ith C H A ID alg o rith m .

Cytaty

Powiązane dokumenty

• The differences of hardness between different elements of the boom structure can provide useful information about the fatigue level of different structural parts, for the

[…] znajdując się, podobnie jak upodobnienie oparte na rozwadze, w linii tego, co możliwe w praktyce (nie w linii agibile, lecz w linii factibile), poznanie poetyc- kie

IK A.. W Gimnazjum Marii Magdaleny w Poznaniu młody Stanisław dał się poznać jako zagorzały obrońca funkcjonującej tam pomimo wielu przeciwności bibliote­ ki

Early termination of study was performed after 16 months because patients assigned to high hemoglobin group (target level 13,5g/dl) showed higher rate of

Celem artykułu jest analiza podstaw teoretycznych i metodycznych oceny interwencji publicznej oraz ewaluacja nieodpłatnych usług informacyjno-kon- sultacyjnych dla MSP,

Podkre s lono w nim, t.e ten sposob przedstawiania danych powierzchniowych (dwuwumiarowych, 2D) jest szczegolnie przydatny do a na- lizy elementow liniowych ,

Włodzimierz Rączkowski,Andrzej Weber..

Ponie­ waż w tym czasie wzrosła znacznie ilość polonijnej młodzieży w publicz­ nych szkołach średnich i na uniw ersytetach, zaczęto wprowadzać tam naukę