• Nie Znaleziono Wyników

Systemy rekomendacyjne cz˛esto słu˙z ˛a do generowania spersonalizowanej oferty sprzeda˙zy na bazie analizy profili klientów. Jako przykład posłu˙zy´c mo˙ze sie´c marketów Castorama, która prosi swoich klientów o podanie kodu poczto-wego, aby zebra´c informacj˛e o ich pochodzeniu. Dzi˛eki tej wiedzy przedsi˛ebior-stwo mo˙ze jak najlepiej dostosowa´c zaopatrzenie sklepów, bior ˛ac pod uwag˛e za-potrzebowanie kupuj ˛acych.

4.2.1. Profil klienta

Profil klienta powinien zawiera´c jak najwi˛ecej istotnych danych. Standardowo umieszcza si˛e w nim atrybuty charakteryzuj ˛ace kupuj ˛acego: adres zamieszkania, dane sprzeda˙zowe oraz dane dotycz ˛ace sprzedanych ofert. Na podstawie profilu mo˙zna bada´c rentowno´s´c danego klienta, a z danych o sprzeda˙zy wywnioskowa´c, na jakie produkty kupuj ˛acego „sta´c” oraz oceni´c rozwój jego siły nabywczej. Uj-muj ˛ac to ogólniej: działanie systemu rekomendacyjnego z wykorzystaniem pro-filu u˙zytkownika mo˙ze polega´c mi˛edzy innymi na [2]: filtrowaniu informacji, wy-znaczeniu podobie ´nstwa mi˛edzy konsumentami, zarekomendowaniu produktu.

4.2.2. Filtrowanie informacji

Filtrowanie informacji powinno dostarczy´c odpowied´z na pytanie, jakie cechy klienta s ˛a najistotniejsze z biznesowego punktu widzenia, a jakie nie wnosz ˛a ˙zad-nej informacji. Do metod filtracji zalicza si˛e [2]:

• metod˛e demograficzn ˛a,

• metod˛e kolaboratywn ˛a lub jej modyfikacj˛e bazuj ˛ac ˛a na zwi ˛azkach mi˛edzy pro-duktami,

• metod˛e opart ˛a na zawarto´sci, • metod˛e hybrydow ˛a,

• metod˛e bazuj ˛ac ˛a na przypadkach u˙zycia.

Filtrowanie demograficzne

Dane demograficzne mog ˛a bezpo´sredniego posłu˙zy´c do znalezienia zwi ˛azku mi˛edzy produktami a ich nabywcami (jak w przykładzie sieci sklepów

Casto-rama). Ten sposób filtrowania jest nieskomplikowany. Mo˙ze jednak nie

dopro-wadzi´c do wygenerowania spersonalizowanych ofert. Dlatego przy budowie sys-temów rekomentacji nale˙zy ł ˛aczy´c ró˙zne metody filtrowania, aby rekomendacje nie opierały si˛e tylko na sterotypowych informacjach.

Filtrowanie kolaboratywne

Podczas filtrowania tego typu tworzone s ˛a pewne grupy klientów i rekomen-dacje produktów, które były kupowane przez innych odbiorców z danej grupy. Ta metoda opiera si˛e na podobie ´nstwach mi˛edzy konsumentami, które najlepiej wyznacza´c w systemach z du˙z ˛a liczb ˛a u˙zytkowników. Bowiem im wi˛eksza liczba

4.2. Charakterystyka systemów rekomendacyjnych

konsumentów, tym wi˛eksza szansa na poprawne dopasowanie kolejnego klienta do istniej ˛acych grup. W algorytmie takiej filtracji mo˙zna wyró˙zni´c nast˛epuj ˛ace kroki [3]:

1. Obliczenie podobie ´nstwa mi˛edzy u˙zytkownikami. 2. Utworzenie grup i podział konsumentów.

3. Wybranie produktów kupowanych najcz˛e´sciej przez klientów z danej grupy. 4. Ewentualne zaoferowanie produktów z kroku trzeciego klientom z danej

grupy, którzy ich nie kupili.

Jest to nieskomplikowana metoda, niewymagaj ˛aca specyficznej wiedzy o ofe-rowanych produktach. W algorytmie nale˙zy zwróci´c baczniejsz ˛a uwag˛e na krok trzeci. Wybór produktów powinien odbywa´c si˛e według odpowiednio sprecyzo-wanej reguły. Nale˙zy wzi ˛a´c pod uwag˛e to, ˙ze procedura ta nie wygeneruje listy produktów kupowanych cyklicznie, co na pewno mo˙ze zmniejszy´c zysk ze sprze-da˙zy. Ponadto automatycznie generowane oferty dóbr mog ˛a nie adaptowa´c si˛e do odr˛ebnych oczekiwa ´n pewnych klientów. Dlatego przy wyznaczaniu reguły mo˙zna wykorzysta´c metody opieraj ˛ace si˛e na podobie ´nstwach mi˛edzy produk-tami. W tym algorytmie nale˙zy zbudowa´c macierz M cz˛esto´sci wyst˛epowania par produktów. Dla danego klienta C , który dokonał ju˙z zakupu, mo˙zna wyró˙zni´c nast˛epuj ˛ace kroki [3]:

1. Wybranie z macierzy M najcz˛e´sciej wyst˛epuj ˛acych produktów z ka˙zdym pro-duktem kupionym przez klienta C , pomijaj ˛ac ju˙z zrealizowane transakcje. 2. Wybranie z produktów z kroku pierwszego elementów, które najcz˛e´sciej

wy-st˛epuj ˛a z produktami kupionymi przez klienta C .

Nale˙zy wybra´c te produkty, które były kupowane razem z produktami klienta

C , nast˛epnie nale˙zy wyodr˛ebni´c te dobra, które były najcz˛e´sciej kupowane z

pionymi ju˙z produktami. Na przykład produkt A mo˙ze by´c prawie zawsze ku-powany razem z produktem B oraz D, przy czym produkt B mo˙ze by´c zawsze kupowany razem z produktem A, za´s produkt D przez pewnych klientów był ku-powany osobno.

Filtrowanie informacji oparte na zawarto´sci

W metodzie tej korzysta si˛e z danych sprzeda˙zowych, czyli z historii zakupów danego konsumenta. Generowanie oferty opiera si˛e na wyborach dokonywanych przez pojedynczego klienta i przez to mo˙ze by´c ukierunkowane tylko na w ˛ask ˛a grup˛e produktów.

Metoda filtracji bazuj ˛aca na przypadkach u˙zycia

Metoda ta wykorzystuje histori˛e u˙zycia systemu rekomendacyjnego [4]. Jej działanie polega na: zapami˛etywaniu ofert wygenerowanych przez system po-zytywnie odebranych i sfinalizowanych oraz ofert, które nie przyniosły pozy-tywnego skutku; konstruowaniu i zastosowaniu pewnych heurystyki dla nowych b ˛ad´z stałych klientów.

Metoda hybrydowa

Podej´scie hybrydowe pozwala poł ˛aczy´c wy˙zej wymienione metody w dowol-nych, uzupełniaj ˛acych si˛e kombinacjach. Na przykład mo˙zna skorzysta´c z da-nych demograficzda-nych i wst˛epnie zgrupowa´c klientów, by pó´zniej zastosowa´c metod˛e bazuj ˛ac ˛a na podobie ´nstwach mi˛edzy produktami.

4.2.3. Zwi ˛azki mi˛edzy klientami a produktami

Metody filtracji bazuj ˛ace na danych demograficznych, zawarto´sci czy przy-padkach u˙zycia polegaj ˛a na znalezieniu relacji mi˛edzy klientem a produktem. Rozpatruj ˛ac przypadki indywidualnie wzgl˛edem klienta, dany produkt mo˙ze zo-sta´c zakwalifikowany jako produkt polecany lub niepolecany. Do technik, które na to pozwalaj ˛a, zalicza si˛e m.in.: klasyfikatory i metody analizy skupie ´n, drzewa decyzyjne, wnioskowanie rozmyte, sieci neuronowe.

Istnieje wiele narz˛edzi umo˙zliwiaj ˛acych przeanalizowanie opłacalno´sci za-rekomendowania danego produktu. Omówione ni˙zej wybrane metody pozwa-laj ˛a oszacowa´c skłonno´sci klientów do: podj˛ecia szerszych/dodatkowych zaku-pów, zdecydowania si˛e na kupno dro˙zszych produktów. Pozwalaj ˛a te˙z zwi˛ekszy´c sprzeda˙z oferowanych artykułów.

Drzewa decyzyjne

Metoda ta polega na podziale zbioru na homogeniczne grupy, najlepiej w jak najmniejszej liczbie kroków. Budowa takiego drzewa podziału nast˛epuje od ko-rzenia (ang. root), gdzie znajduj ˛a si˛e wszystkie zgromadzone dane. Wybór atry-butu do sklasyfikowania danych i ich podziału, czyli do budowy gał˛ezi drzewa decyzyjnego, mo˙zna oprze´c na miarze entriopii H pozyskanej informacji: • entropia Shannona – jest to ´srednia wa˙zona ilo´sci informacji niesionej przez

pojedyncz ˛a wiadomo´s´c (gdy jednostk ˛a entropii jest bit): −X

i

P (xk) log2P (xk), (4.1) gdzie P (xk) to prawdopodobie ´nstwo wyst ˛apienia xk.

• miara Gini’ego – jest to suma iloczynów liczebno´sci danej klasy w stosunku do liczebno´sci wszystkich klas wyra˙zaj ˛aca si˛e wzorem:

X

i , j

#ki#kj

(#K )2 , i 6= j. (4.2) Wzór ten mo˙zna zastosowa´c, je˙zeli prawdopodobie ´nstwo a priori przynale˙zno-´sci do klasy ki liczone jest jako stosunek liczno´sci obserwacji klasy ki do licz-no´sci wszystkich próbek#ki

#K.

• testy statystyczne, np. test χ2, test ilorazu wiarogodno´sci (test G).

Ostatnim członem drzewa s ˛a li´scie, w których znajduj ˛a si˛e podgrupy danych. Zako ´nczenie budowy drzewa mo˙ze nast ˛api´c, gdy wszystkie obserwacje zostały

4.2. Charakterystyka systemów rekomendacyjnych

prawidłowo sklasyfikowane (co jest raczej nierealistyczne). Mo˙zna zatem okre-´sli´c ko ´ncow ˛a maksymaln ˛a liczb˛e obserwacji maj ˛ac ˛a znale´z´c si˛e w li´sciu drzewa. Miar ˛a poprawno´sci klasyfikacji mo˙ze by´c liczba przypadków bł˛ednie zaklasyfi-kowanych w stosunku do liczby wszystkich przypadków, a dla zmiennej ci ˛agłej mo˙ze to by´c bł ˛ad ´srednio–kwadratowy predykcji.

Naiwny klasyfikator Bayesa (NBC)

Metoda ta opiera si˛e na regule Bayesa. Maj ˛ac zbiór danych mo˙zna okre-´sli´c tzw. prawdopodobie ´nstwo a priori P (kj) przynale˙zno´sci do danej klasy kj. Nast˛epnie okre´slana jest szansa przynale˙zno´sci obserwacji do danej klasy, czyli prawdopodobie ´nstwo warunkoweQ

kP (xk|kj). Zakłada si˛e, ˙ze prawdopodobie ´ n-stwa te s ˛a niezale˙zne. W efekcie ko ´ncowym obliczane jest prawdopodobie ´nstwo

a posteriori dane wzorem

P (kj|X ) = P (kj)Y

k

P (xk|kj). (4.3) Nowa obserwacja zakwalifikowana jest do tej klasy, dla której warto´s´c prawdopo-dobie ´nstwa a posteriori jest najwi˛eksza.

Metoda najbli˙zszego s ˛asiada

Metoda ta wykorzystuje wiedz˛e o produktach przechowywanych w bazie da-nych. Na podstawie informacji o cenie czy kategorii produktu mo˙zna wyznaczy´c podobie ´nstwa mi˛edzy ofertami. Wybrane funkcje odległo´sci oraz podobie ´nstwa zostały wyczerpuj ˛aco opisane w pracy [2]. Jedn ˛a z najbardziej popularnych funk-cji podobie ´nstwa jest cosinusowa funkcja podobie ´nstwa.

4.2.4. Zwi ˛azki mi˛edzy klientami

Filtrowanie kolaboratywne wykorzystuje ide˛e grupy klientów, na podstawie której mo˙ze wygenerowa´c rekomendowane produkty. Wyznaczanie podobie ´ n-stwa mi˛edzy konsumentami mo˙ze odbywa´c si˛e poprzez klasyfikacj˛e, grupowanie czy metod˛e najbli˙zszych s ˛asiadów. Do oceny podobie ´nstwa mi˛edzy profilami s ˛a wspomniane wcze´sniej funkcje odległo´sci.

Wa˙znym etapem jest utworzenie s ˛asiedztwa. W skrajnym przypadku do s ˛ a-siedztwa mog ˛a zalicza´c si˛e wszyscy konsumenci. Jednak najcz˛e´sciej stosuje si˛e metod˛e najlepszych s ˛asiadów lub progu korelacji. Pierwsza z nich gwa-rantuje stworzenie s ˛asiedztwa, lecz mo˙ze ono by´c niemiarodajne. Nieodfiltro-wanie dalszych s ˛asiadów mo˙ze mie´c znacz ˛acy wpływ na wygenerowane oferty. Druga z metod tworzenia s ˛asiedztwa bazuje na stwierdzeniu, który klient znaj-duje si˛e w s ˛asiedztwie innego klienta. Polega ona na okre´sleniu progu korelacji i mo˙ze spowodowa´c nieutworzenie s ˛asiedztwa dla jakiego´s klienta, co nie po-zwoli na wygenerowanie ofert. Po utworzeniu s ˛asiedztwa nale˙zy oceni´c, jakie rekomendacje przynios ˛a zamierzony efekt. Maj ˛ac klientów z danego s ˛asiedztwa

oraz histori˛e ich zakupów mo˙zna dokona´c predykcji, czy dany konsument za-reaguje pozytywnie na rekomendowany produkt. Predykcja taka mo˙ze by´c wy-znaczona na podstawie stosunku sfinalizowanych ofert do ofert odrzuconych. Mo˙zna równie˙z wyliczy´c cen˛e jaka ma by´c zaoferowana za dany produkt, wyko-rzystuj ˛ac przy tym median˛e, ´sredni ˛a i ´sredni ˛a wa˙zon ˛a cen.