SYSTEMY WYSZUKIWANIA INFORMACJI

(1)

Agnieszka Nowak - Brzezi«ska

28 listopada 2019

Metoda ªa«cuchowa - metoda klasyczna + modykacje Wykªad 6 i 7

(2)

(3)

(4)

(5)

Zakªadamy i» znany jest system wyszukiwania S, a wi¦c zbiór obiektów X, atrybutówA, warto±ci tych atrybutówVoraz funkcja informacji ρ.

Obiekty opisane s¡ iloczynem odpowiednich niezaprzeczonych deskryptorów. S¡ one pami¦tane w metodzie ªa«cuchowej w dowolnej kolejno±ci.

Obiektom przyporz¡dkowujemy zbiór liczb zwanych adresami obiektów okre±lony za pomoc¡ funkcji: µ : X → N gdzie: N- zbiór liczb naturalnych.

W systemie zachodzi nast¦puj¡ca zale»no±¢:

µ(x ) = µ(y ) ↔ tx = ty, takie same adresy maj¡ obiekty o jednakowym opisie deskryptorowym.

(6)

Denicja listy ªa«cuchowej

Dla ka»dego deskryptorad_i = (a_i, v_i) ∈ D (D - zbiór wszystkich deskryptorów systemu) tworzona jest listaL(d_i) o nast¦puj¡cej postaci:

L(d_i) = {n₁− n₂− . . . − n_k}

gdzien₁ jest adresem pierwszego obiektu zawieraj¡cego w swoim opisie deskryptordi , a pozostaªe elementy n₁, n₂, . . . , nk s¡

odsyªaczamido kolejnych obiektów zawieraj¡cych w swoim opisie ten deskryptor. List¦L(d_i) nazywamy list¡ ªa«cuchow¡ deskryptorad_i.

(7)

Odsyªacze w listach ªa«cuchowych zawieraj¡ informacj¦, gdzie znajduje si¦ kolejny obiekt zawieraj¡cy w swoim opisie dany deskryptor.

Zazwyczaj umieszczane s¡ one bezpo±rednio przy ka»dym deskryptorze ka»dego obiektu w kartotece wyszukiwawczej.

Do ustalenia adresów pozostaªych obiektów mo»na u»y¢

nast¦puj¡cych typów odsyªaczy:

Odsyªacz bezwzgl¦dny zawiera on bezpo±redni adres obiektu w kartotece wyszukiwawczej.

Odsyªacz wzgl¦dny jest on tworzony wzgl¦dem pierwszego obiektu zawieraj¡cego w swoim opisie dany deskryptor.

Odsyªacz jako skok zawiera ró»nic¦ pomi¦dzy adresami kolejnych obiektów zawieraj¡cych w swoim opisie dany deskryptor.

(8)

Kartotek¦ wyszukiwawcz¡ tworz¡ opisy deskryptorowe obiektów z umieszczonymi zwykle bezpo±rednio pod tym opisem odsyªaczami, tzn. odsyªacz jest umieszczony przy ka»dym deskryptorze bezpo±rednio przy opisie obiektu.

Listy ªa«cuchowe nie s¡ pami¦tane w systemie, s¡

generowane na bie»¡co, w miar¦ potrzeby.

W pami¦ci oprócz obiektów z odsyªaczami umieszczamy tylko tablic¦ zakotwicze«.

(9)

Tablica zakotwicze« dla ka»dego deskryptoradi podaje adres pierwszego obiektu w ªa«cuchu i ilo±¢ obiektów w ªa«cuchu (dªugo±¢ ªa«cucha ):

tab(d_i) = (nⁱ₁, L(d_i))

gdzienⁱ₁ jest to adres pierwszego takiego obiektu w Systemie, który w swoim opisie zawiera deskryptord_i .

d_i n₁ L(d_i) ... ... ...

... ... ...

(10)

Znaj¡c odsyªacze ªatwo uzyska¢ adresy wszystkich obiektów zawieraj¡cych w swoim opisie deskryptord_i :

µ(x₁ⁱ) = n₁, µ(x₂ⁱ) = n₁+ n₂, . . . , µ(x_jⁱ) = n₁+ nj

gdzie: x_jⁱ - j -ty obiekt zawieraj¡cy w swoim opisie deskryptor d_i . µ(x₁ⁱ) = n₁ to pierwszy obiekt w systemie, który w swoim opisie ma deskryptord_i.

µ(x₂ⁱ) = n₁+ n₂ to drugi obiekt w systemie, który w swoim opisie ma deskryptordia.

µ(x_jⁱ) = n₁+ n_j to j-ty obiekt w systemie, który w swoim opisie ma deskryptord_i^b.

azakªadaj¡c, »e u»yto odsyªaczy wzgl¦dnych b¡d¹ skoku

bzakªadaj¡c, »e u»yto odsyªaczy wzgl¦dnych

(11)

ka»dego deskryptoradi podaje adres pocz¡tku ªa«cucha i dªugo±¢

ªa«cucha (liczb¦ elementów ªa«cucha):

tab(di) = (n₁, L(di)) dla di ∈ D, gdzie:

n₁ = µ(x₁ⁱ).

U w a g a. Zwykle odsyªacze umieszczone s¡ bezpo±rednio przy ka»dym deskryptorze w opisach obiektów. W pami¦ci oprócz obiektów z odsyªaczami umieszczamy tylko tablic¦ zakotwicze«

(ªa«cuchy oddzielnie nie s¡ zapami¦tywane).

(12)

Niech pytanie do systemuS b¦dzie zadane w postaci termut b¦d¡cego sum¡ termów skªadowych. Odpowied¹ na pytaniet jest zatem sum¡ odpowiedzi na pytania skªadowe. Rozpatrzmy

szczegóªowo odpowiadanie na pytanie skªadowet_i .

Je»eli term skªadowy jest pojedynczym deskryptoremti = di

to odpowied¹ znajdujemy w nast¦puj¡cy sposób: z tablicy zakotwicze« dla di znajdujemy(n₁,L(d_i)), a nast¦pnie generujemy zbiór obiektów (zbiór adresów obiektów) zgodnie ze znalezionym ªa«cuchem dla deskryptora d_i .

Je»eli t_i = d₁· d₂· . . . · d_k , odpowied¹ znajdujemy w nast¦puj¡cy sposób: z tablicy zakotwicze« znajdujemy ªa«cuchy dla wszystkich deskryptorów pytania.

(13)

Lmin(di) =min

d_i {L(di)}

Dalej wyszukiwanie odpowiedzi mo»e odbywa¢ si¦ jednym z podanych sposobów:

1 Generujemy wybrany ªa«cuch minimalny i metod¡ przegl¡du zupeªnego sprawdzamy, czy wybrane obiekty zawieraj¡ w swoim opisie pozostaªe deskryptory pytaniati . Odpowied¹ zatem mo»na zapisa¢ jako:

σ(ti) = {xi ∈ Lmin(di)&^

d_j∈t_i

dj6= di⇒ dj∈ tx_i}

2 Porównujemy elementy wybranego ªa«cuchaLminz pozostaªymi ªa«cuchami deskryporów pytania i wybieramy tylko elementy wspólne, które stanowi¡ odpowied¹ na pytanieti .

σ(ti) = {xi ∈ [Lmin(di) ∩ (\

j

L(dj))], di, dj∈ ti, di 6= dj}

(14)

Kartoteka wtórna

tx₁ = (a, a₁)(b, b₁)(c, c₁) t_x₂ = (a, a₁)(b, b₁)(c, c₂) t_x₃ = (a, a₂)(b, b₂)(c, c₃) tx₄ = (a, a₂)(b, b₂)(c, c₄) t_x₅ = (a, a₁)(b, b₂)(c, c₁) t_x₆ = (a, a₁)(b, b₂)(c, c₂) tx₇ = (a, a₂)(b, b₂)(c, c₃) tx₈ = (a, a₂)(b, b₂)(c, c₄)

(15)

Kartoteka wtórna

t_x₁ = (a, a₁)(b, b₁)(c, c₁) t_x₂ = (a, a₁)(b, b₁)(c, c₂) tx₃ = (a, a₂)(b, b₂)(c, c₃) t_x₄ = (a, a₂)(b, b₂)(c, c₄) t_x₅ = (a, a₁)(b, b₂)(c, c₁) tx₆ = (a, a₁)(b, b₂)(c, c₂) tx₇ = (a, a₂)(b, b₂)(c, c₃) t_x₈ = (a, a₂)(b, b₂)(c, c₄) + funkcja adresuj¡ca µ

µ(x₁) →1, µ(x₂) →2, µ(x₃) →3,µ(x₄) →4, µ(x₅) →5, µ(x₆) →6, µ(x₇) →3 oraz µ(x₈) →4

(16)

Kartoteka wyszukiwawcza z odsyªaczami bezwzgl¦dnymi 1 : (a, a₁) (b, b₁) (c, c₁)

2 2 5

2 : (a, a1) (b, b₁) (c, c₂)

5 ∅ 6

3 : (a, a₂) (b, b₂) (c, c₃)

4 4 ∅

4 : (a, a₂) (b, b₂) (c, c₄)

∅ 5 ∅

5 : (a, a1) (b, b₂) (c, c₁)

6 6 ∅

6 : (a, a₁) (b, b₂) (c, c₂)

∅ ∅ ∅

(17)

Kartoteka wyszukiwawcza z odsyªaczami wzgl¦dnymi 1 : (a, a₁) (b, b₁) (c, c₁)

+1 +1 +4

2 : (a, a1) (b, b₁) (c, c₂)

+4 ∅ +4

3 : (a, a₂) (b, b₂) (c, c₃)

+1 +1 ∅

4 : (a, a₂) (b, b₂) (c, c₄)

∅ +2 ∅

5 : (a, a1) (b, b₂) (c, c₁)

+5 +3 ∅

6 : (a, a₁) (b, b₂) (c, c₂)

∅ ∅ ∅

(18)

Kartoteka wyszukiwawcza z odsyªaczami w postaci skoku 1 : (a, a₁) (b, b₁) (c, c₁)

+1 +1 +4

2 : (a, a1) (b, b₁) (c, c₂)

+3 ∅ +4

3 : (a, a₂) (b, b₂) (c, c₃)

+1 +1 ∅

4 : (a, a₂) (b, b₂) (c, c₄)

∅ +1 ∅

5 : (a, a1) (b, b₂) (c, c₁)

+1 +1 ∅

6 : (a, a₁) (b, b₂) (c, c₂)

∅ ∅ ∅

(19)

Tablica zakotwicze«

d_i n₁ L(d_i) (a, a1) 1 4 (a, a2) 3 2 (b, b1) 1 2 (b, b2) 3 4

(c, c1) 1 2

(c, c2) 2 2 (c, c3) 3 1

(c, c4) 4 1

Tablica zakotwicze« b¦dzie dla wszystkich 3 przypadków (z ró»nymi odsyªaczami) taka sama

(20)

Dla pytania t = (a, a2)(b, b2) + (c, c3)

t = t₁+ t₂ gdzie t1= (a, a2)(b, b2), t2= (c, c3) Dla pytania t1:

szukamy informacji w tablicy zakotwicze« dla ka»dego deskryptora pytania t₁:

tab(a, a2) = (3, 2) tab(b, b2) = (3, 4)

wybieramy ªa«cuch minimalny:

L_min(di) = L(a, a2)

generujemy ªa«cuch dla (a, a2): L(a, a2) = {3 − 1 − ∅}

µ(x₁^(a,a²⁾) = n₁=3, µ(x₂^(a,a²⁾) = n₁+ n₂=3 + 1 = 4

odpowied¹ przybli»ona: σ(t1) ≈ L(a, a2) = {3, 4} = {x3, x₄, x₇, x₈} odpowied¹ dokªadna:

(b, b2) ≤ tx₃, (b, b2) ≤ tx₄, (b, b2) ≤ tx₇, (b, b2) ≤ tx₈

σ(t₁) = {x₃, x₄, x₇, x₈} dla pytania t2:

szukamy informacji w tablicy zakotwicze« dla ka»dego deskryptora pytania t₂:

tab(c, c3) = (3, 1)

generujemy ªa«cuch dla (c, c3): L(c, c3) = {3 − ∅}

µ(x₁^(c,c³⁾) = n₁=3, σ(t2) = {x₃, x₇}

(21)

t = t₁+ t₂ gdzie t1= (a, a2)(b, b2), t2= (c, c3) Dla pytania t1:

szukamy informacji w tablicy zakotwicze« dla ka»dego deskryptora pytania t₁:

tab(a, a2) = (3, 2) tab(b, b2) = (3, 4)

L_min(di) = L(a, a2)

generujemy ªa«cuch dla (a, a2): L(a, a2) = {3 − 1 − ∅}

µ(x₁^(a,a²⁾) = n₁=3, µ(x₂^(a,a²⁾) = n₁+ n₂=3 + 1 = 4

generujemy ªa«cuch dla (b, b2): L(b, b2) = {3 − 1 − 2 − 3 − ∅}:

µ(x₁^(b,b2)) = n₁=3,

µ(x₂^(b,b²⁾) = n₁+ n₂=3 + 1 = 4,µ(x₃^(b,b²⁾) = n₁+ n₃=3 + 2 = 5, µ(x₄^(b,b2)) = n₁+ n₄=3 + 3 = 6

σ(t₁) = {x₃, x₄, x₇, x₈} dla pytania t2:

szukamy informacji w tablicy zakotwicze« dla ka»dego deskryptora pytania t₂:

tab(c, c3) = (3, 1)

generujemy ªa«cuch dla (c, c3): L(c, c3) = {3 − ∅}

µ(x^(c,c³⁾) = n =3, σ(t ) = {x , x }

(22)

tx1= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, PR) t_x2= (A₁, K ) · (A₂, c) · (A₃, S ) · (A₄, A) · (A₅, BT ) tx3= (A₁, K ) · (A₂, b) · (A₃, P) · (A₄, A) · (A₅, BT ) t_x4= (A₁, M) · (A₂, a) · (A₃, S ) · (A₄, T ) · (A₅, BT ) tx5= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR) t_x6= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) tx7= (A₁, K ) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) tx8= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx9= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) tx10= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR) t_x11= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) tx12= (A₁, K ) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) t_x13= (A₁, M) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) tx14= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) t_x15= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx16= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx17= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, PR) tx18= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) t = (A , K ) · (A , b) · (A, W ) · (A , D) · (A , MR)

(23)

tx1= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, PR) t_x2= (A₁, K ) · (A₂, c) · (A₃, S ) · (A₄, A) · (A₅, BT ) tx3= (A₁, K ) · (A₂, b) · (A₃, P) · (A₄, A) · (A₅, BT ) t_x4= (A₁, M) · (A₂, a) · (A₃, S ) · (A₄, T ) · (A₅, BT ) tx5= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR) t_x6= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) tx7= (A₁, K ) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) tx8= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx9= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) tx10= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR) t_x11= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) tx12= (A₁, K ) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) t_x13= (A₁, M) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) tx14= (A₁, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) t_x15= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx16= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) tx17= (A₁, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, PR) tx18= (A₁, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) t = (A , K ) · (A , b) · (A, W ) · (A , D) · (A , MR)

(24)

+ funkcja adresuj¡ca µ

µ(x₁) →1, µ(x2) →2, µ(x3) →3,µ(x4) →4, µ(x5) →5, µ(x₆) →6, µ(x7) →7 oraz µ(x8) →8,µ(x9) →9, µ(x10) →6, µ(x₁₁) →9,µ(x₁₂) →10, µ(x₁₃) →11, µ(x₁₄) →9, µ(x₁₅) →12 oraz µ(x₁₆) →12,µ(x₁₇) →13, µ(x₁₈) →14,

µ(x₁₉) →15,µ(x20) →9

(25)

2 : (A1 2 3 4 5

3 : (A1, K ) · (A₂, b) · (A₃, P) · (A₄, A) · (A₅, BT ) 4 : (A1, M) · (A₂, a) · (A₃, S ) · (A₄, T ) · (A₅, BT ) 5 : (A1, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR) 6 : (A1, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) 7 : (A1, K ) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DR) 8 : (A1, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) 9 : (A1, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) 10 : (A1, K ) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) 11 : (A1, M) · (A₂, b) · (A₃, S ) · (A₄, T ) · (A₅, BT ) 12 : (A1, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, DC ) 13 : (A1, M) · (A₂, c) · (A₃, W ) · (A₄, D) · (A₅, PR) 14 : (A1, M) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, DR) 15 : (A1, K ) · (A₂, b) · (A₃, W ) · (A₄, D) · (A₅, MR)

(26)

+1 +4 +2 +1 +1 3 : (A₁, K ) (A₂, b) (A₃, P) (A₄, A) (A₅, BT )

+5 +4 +∅ +∅ +2

4 : (A₁, M) (A₂, a) (A₃, S) (A₄, T ) (A₅, BT )

+4 +∅ +8 +6 +8

5 : (A₁, M) (A₂, b) (A₃, W ) (A₄, D) (A₅, MR)

+5 +8 +5 +5 +10

6 : (A₁, M) (A₂, c) (A₃, W ) (A₄, D) (A₅, DR)

+7 +5 +6 +6 +1

7 : (A₁, K ) (A₂, c) (A₃, W ) (A₄, D) (A₅, DR)

+7 +6 +7 +7 +3

8 : (A₁, M) (A₂, c) (A₃, W ) (A₄, D) (A₅, DC )

+10 +10 +8 +8 +4

9 : (A₁, K ) (A₂, b) (A₃, W ) (A₄, D) (A₅, DR)

+8 +9 +11 +11 +8

10 : (A₁, K ) (A₂, b) (A₃, S) (A₄, T ) (A₅, BT )

+13 +10 +9 +7 +9

11 : (A₁, M) (A₂, b) (A₃, S) (A₄, T ) (A₅, BT )

+11 +13 +∅ +∅ +∅

12 : (A₁, M) (A₂, c) (A₃, W ) (A₄, D) (A₅, DC )

+12 +11 +12 +12 +∅

13 : (A₁, M) (A₂, c) (A₃, W ) (A₄, D) (A₅, PR)

+13 +∅ +13 +13 +∅

14 : (A₁, M) (A₂, b) (A₃, W ) (A₄, D) (A₅, DR)

+∅ +14 +14 +14 +∅

15 : (A₁, K ) (A₂, b) (A₃, W ) (A₄, D) (A₅, MR)

+∅ +∅ +∅ +∅ +∅

(27)

di n₁ L(d_i) (A₁, K ) 2 6 (A₁, M) 1 9 (A₂, a) 4 1 (A₂, b) 1 8 (A₂, c) 2 6 (A₃, W ) 1 10

(A₃, S) 2 4 (A₃, P) 3 1 (A₄, D) 1 10 (A₄, A) 2 2 (A₄, T ) 4 3 (A₅, PR) 1 2 (A₅, BT ) 2 5 (A₅, DR) 6 4 (A₅, MR) 5 2 (A₅, DC ) 8 2

(28)

L(A₂, b) = {1 − 2 − 4 − 7 − 8 − 9 − 13 − 14 − ∅}, L(A₂, c) = {2 − 4 − 5 − 6 − 10 − 11 − ∅}, L(A₂, a) = {4 − ∅},

L(A₃, W ) = {1 − 4 − 5 − 6 − 7 − 8 − 11 − 12 − 13 − 14 − ∅}, L(A₃, S) = {2 − 2 − 8 − 9 − ∅},

L(A₃, P) = {3 − ∅},

L(A₄, D) = {1 − 4 − 5 − 6 − 7 − 8 − 11 − 12 − 13 − 14 − ∅}, L(A₄, A) = {2 − 1 − ∅},

L(A₄, T ) = {4 − 6 − 7 − ∅}, L(A₅, PR) = {1 − 12 − ∅},

L(A₅, BT ) = {2 − 1 − 2 − 10 − 11 − ∅}, L(A₅, MR) = {5 − 10 − ∅},

L(A₅, DR) = {6 − 1 − 3 − 8 − ∅}, L(A₅, DC ) = {8 − 4 − ∅}.

Odsyªacze s¡ pami¦tane przy opisach obiektów. Uwaga ! a«cuchy nie s¡

pami¦tane

(29)

t₁= (A₄, D) · (A₂, b).

Z tablicy zakotwicze« znajdujemy:

tab(A₄, D) = (1, 10), tab(A₂, b) = (1, 8),

Lmin= L(A₂, b) = {1 − 2 − 4 − 7 − 8 − 9 − 13 − 14 − ∅}.

Po przetworzeniu ªa«cucha uzyskujemy:

L(A₂, b) = {1, 3, 5, 8, 9, 10, 14, 15}

Porównujemy elementy Lminz L(A4, D)i wybieramy elementy wspólne:

L(A₄, D) = L(A₄, D) = {1 − 4 − 5 − 6 − 7 − 8 − 11 − 12 − 13 − 14 − ∅}

po przetworzeniu ªa«cucha:

L(A₄, D) = {1, 5, 6, 7, 8, 9, 12, 13, 14, 15}

σ(t₁) = {1, 3, 5, 8, 9, 10, 14, 15} ∩ {1, 5, 6, 7, 8, 9, 12, 13, 14, 15}

(30)

P2 = Poda¢ pracowników technicznych w wieku pomi¦dzy 20 a 35 rokiem »ycia lub pracowników z wyksztaªceniem ±rednim

nieadministracyjnym.

t₂ = (A₂, b) · (A₄, T ) + (A₃, S ) · (A₄, T ) + (A₃, S ) · (A₄, D) Term t2 jest sum¡ termów skªadowych t21, t22, t23

t₂ = t₂₁+ t₂₂+ t₂₃, gdzie:

t₂₁= (A₂, b) · (A₄, T ), t₂₂= (A₃, S ) · (A₄, T ), t₂₃= (A₃, S ) · (A₄, D).

Znajdujemy odpowied¹ na pytania skªadowe.

(31)

Rozpatrzmy pierwszy term skªadowy t₂₁= (A₂, b) · (A₄, T ): Z tablicy zakotwicze«:

tab(A₂, b) = (1, 8), tab(A₄, T ) = (4, 3), L_min= L(A₄, T )

Ze wzgl¦du na maª¡ liczb¦ obiektów w ªa«cuchu minimalnym, zastosujemy przegl¡d zupeªny elementów ªa«cucha minimalnego, wybieraj¡c te obiekty, które zawieraj¡

w swoim opisie dodatkowo deskryptor (A2, b).

Wybieramy ªa«cuch minimalny: L(A4, T ) = {4 − 6 − 7 − ∅}

Przetwarzamy ªa«cuch: µ(x₁^(A⁴^{,T )}) = n₁=4, µ(x₂^(A⁴^{,T )}) = n₁+ n₂=4 + 6 = 10, µ(x₃^(A⁴^{,T )}) = n₁+ n₃=4 + 7 = 11

L(A₄, T ) = {4, 10, 11} = {x4, x₁₂, x₁₃}

Tylko opis obiektu x4nie zawiera deskrypora (A2, b): (A2, b) tx₄, (A2, b) ≤ tx₁₂, (A₂, b) ≤ tx₁₄

σ(t₂₁) = {x₁₂, x₁₃}.

(32)

Rozpatrzmy drugi term skªadowy: t22= (A₃, S ) · (A₄, T ).

Z tablicy zakotwicze«:

tab(A₃, S ) = (2, 4), tab(A₄, T ) = (4, 3).

Rozpatrywane b¦d¡ nast¦puj¡ce ªa«cuchy:

Ju» wiemy, »e Lmin= L(A₄, T ) = {4, 10, 11},

L(A₃, S ) = {2 − 2 − 8 − 9 − ∅}

co po przetworzeniu tego ªa«cucha daje nam:

L(A₃, S ) = {2, 4, 10, 11}

Odpowied¹ na pytanie znajdujemy jako przeci¦cie ªa«cucha minimalnego z pozostaªymi:

σ(t₂₂) = L(A₄, T ) ∩ L(A₃, S ) = {4, 10, 11} = {x4, x₁₂, x₁₃}.

(33)

Analogicznie znajdujemy odpowied¹ na kolejny term skªadowy:

t₂₃= (A₃, S ) · (A₄, D) Wiemy ju», »e: L(A3, S ) = {2, 4, 10, 11} oraz, »e

L(A₄, D) = {1 − 4 − 5 − 6 − 7 − 8 − 11 − 12 − 13 − 14 − ∅}

co po przetworzeniu daje: L(A4, D) = {1, 5, 6, 7, 8, 9, 12, 13, 14, 15}

Wtedy przeci¦cie obu ªa«cuchów daje nam odpowied¹ σ(t23) = {∅}.

Opowied¹ na pytanie t2b¦dzie sum¡ odpowiedzi na pytania skªadowe:

σ(t₂) = σ(t₂₁) ∪ σ(t₂₂) ∪ σ(t₂₃), σ(t₂) = {x₁₂, x₁₃} ∪ {x₄, x₁₂, x₁₃} ∪ {∅}

σ(t₂) = {x₄, x₁₂, x₁₃}

(34)

Brak redundancji obiektowej i stosunkowo krótki czas wyszukiwania informacji wi¡»e si¦ ze skomplikowan¡ struktur¡ bazy danych i kªopotliw¡ aktualizacj¡. Modykacje metody maj¡ na celu uproszczenie struktury oraz uªatwienie procesu aktualizacji.

(35)

Budowa ªa«cuchów:

L(di) = {nk− nk−1− nk−2− . . . − n₁},

gdzie: nk= µ(x_kⁱ), to znaczy pierwszy element ªa«cucha jest adresem ostatniego obiektu zawieraj¡cego w swoim opisie deskryptor di; pozostaªe elementy s¡

odsyªaczami do kolejnych (poprzednich) obiektów zawieraj¡cych w swoim opisie desktyptor dⁱ. Adresy obiektów znajdujemy w nast¦puj¡cy sposób:

µ(x_kⁱ) = nk, µ(x_k−ⁱ ₁) = nk− nk−1, . . . , µ(x_jⁱ) = nk− nj

gdzie xjⁱ - j-ty obiekt zawieraj¡cy w swoim opisie deskryptor dⁱ. Wyszukiwanie odpowiedzi odbywa si¦ tak jak w metodzie z ªa«cuchowaniem w przód. Tablica zakotwicze« jest identyczna z tym tylko zastrze»eniem, »e jej pierwsza kolumna zawiera adres ostatniego obiektu zawieraj¡cego w opisie deskryptor dⁱ. Wybranie sposobu ªa«cuchowania nie ma wpªywu na przebieg procesu wyszukiwania informacji. O wyborze metody z ªa«cuchowaniem w przód lub w tyª decyduje projektant systemu bior¡c pod uwag¦ umieszczenie obiektów w pami¦ci maszyny cyfrowej.

(36)

∅ ∅ ∅

2 : (a, a₁) (b, b₁) (c, c₂)

−5 −1 ∅

3 : (a, a₂) (b, b₂) (c, c₃)

∅ ∅ ∅

4 : (a, a₂) (b, b₂) (c, c₄)

−1 −3 ∅

5 : (a, a₁) (b, b₂) (c, c₁)

−4 −2 −4

6 : (a, a₁) (b, b₂) (c, c₂)

−1 −1 −4

(37)

di nk L(d_i)

(a, a1) 6 4

(a, a2) 4 2 (b, b1) 2 2

(b, b2) 6 4

(c, c1) 5 2 (c, c2) 6 2 (c, c3) 3 1 (c, c4) 4 1

(38)

L(a, a1) = {6 − 1 − 4 − 5 − ∅}

L(a, a2) = {4 − 1 − ∅}

L(b, b1) = {2 − 1 − ∅}

L(b, b2) = {6 − 1 − 2 − 3 − ∅}

L(c, c1) = {5 − 4 − ∅}

L(c, c2) = {6 − 4 − ∅}

L(c, c3) = {3 − ∅}

L(c, c4) = {4 − ∅}

(39)

t=t₁+t₂ gdzie^t1= (a,a2)(^b,b2),^t2= (c,c3) Dla pytania^t1:

szukamy informacji w tablicy zakotwicze« dla ka»dego deskryptora pytania^t1:

tab(a,a2) = (3, 2) tab(b,b2) = (3, 4)

Lmin(di) = L(a,a2), który ma 2 elementy:

generujemy ªa«cuch dla (^a,a2): L(^a,a2) = {4 − 1 − ∅}

µ(x₂^(a,a2)) =n₂=4, µ(^x₁^(a,a2)) =n₂−n₁=4 − 1 = 3

odpowied¹ przybli»ona: σ(^t1) ≈ L(a,a2) = {4, 3} = {^x3,x₄,x₇,x₈} odpowied¹ dokªadna:

(b,b2) ≤^t^x3, (^b,b2) ≤^t^x4, (^b,b2) ≤^t^x7, (^b,b2) ≤^t^x8

σ(t₁) = {x₃,x₄,x₇,x₈} dla pytania^t2:

tab(c,c3) = (3, 1)

generujemy ªa«cuch dla (^c,c3): L(^c,c3) = {3 − ∅}

µ(x₁^(c,c³⁾) =nk=3, σ(^t2) = {x₃,x₇}

(40)

t=t₁+t₂ gdzie^t1= (a,a2)(^b,b2),^t2= (c,c3) Dla pytania^t1:

tab(a,a2) = (3, 2) tab(b,b2) = (3, 4)

Lmin(di) = L(a,a2)

generujemy ªa«cuch dla (^a,a2): L(^a,a2) = {4 − 1 − ∅}

µ(x₂^(a,a2)) =n₂=4, µ(^x₁^(a,a2)) =n₂−n₁=4 − 1 = 3

generujemy ªa«cuch dla (^b,b2): L(^b,b2) = {6 − 1 − 2 − 3 − ∅}:

µ(x₄^(b,b2)) =n₄=6,

µ(x₃^(b,b²⁾) =n₄−n₃=6 − 1 = 5,µ(^x₂^(b,b²⁾) =n₄−n₂=6 − 2 = 4, µ(x₁^(b,b²⁾) =n₄−n₃=6 − 3 = 3

σ(t₁) = {3, 4} ∩ {6, 5, 4, 3} = {^x3,x₄,x₇,x₈} dla pytania^t2:

tab(c,c3) = (3, 1)

generujemy ªa«cuch dla (^c,c3): L(^c,c3) = {3 − ∅}

(c,c3) 3, σ(

(41)

Stosowana jest modykacja metody ªa«cuchowej z podwójnym ªa«cuchowaniem i w tyª, i w przód. Wprowadzenie podwójnego ªa«cuchowania nie zmienia samej metody wyszukiwania, ale pozwala bardzo szybko ustali¢ pozycj¦ ka»dego obiektu w ªa«cuchu, co z kolei uªatwia i przyspiesza proces aktualizacji.

Metoda list ªa«cuchowych charakteryzuje si¦ szybkim czasem wyszukiwania, szczególnie w przypadku pyta« ogólnych,

jednodeskryptorowych i mimo zwi¦kszonej zaj¦to±ci pami¦ci, wynikaj¡cej z konieczno±ci pami¦tania odsyªaczy i tablicy zakotwicze«, zysk czasowy przewa»a nad t¡ wad¡. Jednak»e sztywna struktura, wi¡»ca poprzez pola odsyªacz obiekty nale»¡ce do jednego ªa«cucha mo»e by¢ przyczyn¡

skomplikowanej procedury aktualizacji obiektów. W celu poprawy tej sytuacji omówimy modykacj¦ polegaj¡c¡ na ªa«cuchowaniu

dwukierunkowym, gdzie przy poszczególnych warto±ciach deskryptorów mo»emy uzyska¢ informacje na temat adresu poprzednika i nast¦pnika w li±cie ªa«cuchowej, w której rozpatrujemy aktualizacj¦ dotycz¡c¡

pojedynczego obiektu.

(42)

∅ ∅ ∅

+1 +1 +4

2 : (a, a₁) (b, b₁) (c, c₂)

−5 −1 ∅

+4 ∅ +4

3 : (a, a₂) (b, b₂) (c, c₃)

∅ ∅ ∅

+1 +1 ∅

4 : (a, a₂) (b, b₂) (c, c₄)

−1 −3 ∅

∅ +2 ∅

5 : (a, a₁) (b, b₂) (c, c₁)

−4 −2 −4

+5 +3 ∅

6 : (a, a₁) (b, b₂) (c, c₂)

−1 −1 −4

∅ ∅ ∅

(43)

di n₁ nk L(d_i)

(a, a1) 1 6 4

(a, a2) 3 4 2

(b, b1) 1 2 2

(b, b2) 3 6 4

(c, c1) 1 5 2

(c, c2) 2 6 2

(c, c3) 3 3 1

(c, c4) 4 4 1

(44)

Rozpatrzmy pewien podzbiórD₀ zbioru deskryptorówD systemuS(na przykªad podzbiór deskryptorów najcz¦±ciej wyst¦puj¡cych w pytaniach do systemu).

Obiekty w bazie danych grupujemy wedªug wybranego zbioru

deskryptorówD₀⊂ D . Nast¦pnie tworzymy ªa«cuchy dowoln¡ metod¡

(ªa«cuchowanie w przód lub w tyª), ale tylko dla deskryptorówdj∈ D₀. L(dj) = {n₁− n₂− n₃− . . . − nk}, dj∈ D₀, 1 ≤ j ≤ k.

Dla deskryptorówdj∈ D₀ tworzymy równie» tablic¦ zakotwicze«. Pytanie do systemu, jak w poprzednich metodach, zadajemy w postaci termut . Term skªadowy jest postaciti = d₁· d₂· . . . · dk.

(45)

Odpowied¹ na term skªadowy znajdujemy w nast¦puj¡cy sposób:

je»eli wszystkie deskryptory pytania nale»¡ do zbioru^D0 , to odpowied¹ znajdujemy jak w metodzie list ªa«cuchowych bez modykacji,

je»eli pewne deskryptory pytania^dⁱ ∈/ D₀ , to dla pewnego termu^t^j ≤ ti

, którego wszystkie deskryptory^d^j ∈ D₀ , odpowied¹ znajdujemy klasyczn¡ metod¡ list ªa«cuchowych.

W ten sposób znajdujemy zbiór obiektów^X^j: σ(tj) =Xj,

przy czym^Xj⊇Xi . Zbiór obiektów^Xj stanowi odpowied¹ przybli»on¡ na pytanie^ti. Odpowied¹ dokªadn¡ mo»emy znale¹¢ metod¡ przegl¡du zupeªnego w wyszukanym zbiorze obiektów^Xj:

σ(ti) = {xi ∈Xj, ^{^}

d_i∈D/ ₀

di∈tx_i ⇒di∈ti}

je»eli »aden deskryptor pytania nie nale»y do zbioru^D0 , to odpowied¹ znajdujemy metod¡ przegl¡du zupeªnego opisów obiektów w bazie danych.

(46)

Wprowadzona modykacja pozwala upro±ci¢ struktur¦ bazy danych, poniewa» odsyªacze umieszczone s¡ tylko przy niektórych

deskryptorach w opisach obiektów.

O wyborze zbioruD₀ ⊂ D , dla którego tworzymy ªa«cuchy, decyduj¡ takie same wzgl¦dy jak przy wyborze zbioruD⁰ w modykacji metody list inwersyjnych.