Zad 1. Dla zbioru 16 dokumentów opisanych następująco:
X1 = ABEF X2 = ABEFG X3 = ABFG X4 = ACE X5 = AEH X6 = BCF X7 = ABE X8 = ABF X9 = AB X10 = EF X11 = ABCE X12 = ABFGH X13 = ABCEF X14 = ABCD X15 = EFGH X16 = DGH
dokonaj podziału na grupy algorytmem Rocchia. Przyjmij następujące parametry: N1 = 2, N2 = 6, P1 = 0,65, P2 = 0,55. Te same parametry należy wykorzystad przy teście gęstości dla centroidu.
Do określenia współczynnika korelacji należy użyd funkcji:
f x x card p p card p p
i j
i j
i j
( , ) ( )
( )
gdzie pi i pj - zbiory pojęd opisujących dokumenty xi oraz xj.
Zad2. Dany jest zbiór dokumentów X={x1…x10}, które są opisane pojęciami:
tx1=adfg tx2=bcdfhij tx3=aeij tx4=defgh tx5=cehij tx6=adf tx7=bcgj tx8=afghi tx9=dejf tx10=ghij
Dla zbioru dokumentów należy dokonad ich podziału na grupy stosując algorytm Rocchia.
Przedstawid realizację tego algorytmu wybierając jako przypuszczalne centrum grupy kolejno dokumenty x3 i (jeśli zajdzie taka potrzeba) x4.
Założenia:
a)dla testu gęstości: p1=0,2, N1=6, p2=0,4, N2=4. Te same parametry należy wykorzystad przy teście gęstości dla centroidu.
b)dla określenia współczynnika korelacji między xi oraz xj należy stosowad funkcję :
f x x card p p card p p
i j
i j
i j
( , ) ( )
( )
gdzie pi i pj - zbiory pojęd opisujących dokumenty xi oraz xj.
Zad3. W jednym z kroków wiązania w grupy w/g algorytmu Rocchia otrzymano następujące współczynniki korelacji obiektów x1…x6 z przypuszczalnym centrum grupy:
k(x1, xc)=0,20
k(x2, xc)=0,11 k(x3, xc)=0,30 k(x4, xc)=0,48 k(x5, xc)=0,5 k(x6, xc)=0,05 k(x7, xc)=0,28 k(x8, xc)=0,41
Załóżmy, że test gęstości zakłada, iż co najmniej N1=6 obiektów ma współczynnik korelacji (z centrum grupy) wyższy niż p1=0,1 oraz, że co najmniej N2=3 ma ten współczynnik wyższy niż p2=0,4. Jaki jest rezultat tego etapu wiązania obiektów w grupy?