Zadanie 1
W poszczególnych tygodniach działania systemu odpowiedzi na pytania były następujące:
T1 ={X1, X3, X7}
T2 ={X4, X8, X9, X10}
T3 ={X1, X2, X3, X5, X8}
T4 ={X3, X5, X7}
T5 ={X2, X4, X8, X3}
T6 ={X1, X3,X5, X7}
T7 ={X1, X3, X7}
Zakładając, że system S poddany został modyfikacji polegającej na umieszczaniu obiektów będących odpowiedzią na zadawane pytania na górze kartoteki oraz przeszukiwaniu tylko 50% kartoteki bazy danych:
a) Napisz co to za modyfikacja oraz jakie zagrożenia się z nią wiążą b) Napisz jak wyglądać będzie kartoteka wyszukiwawcza po 5 pytaniach
c) Przedstaw proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B) d) Jaka jest kompletność takiej odpowiedzi systemu ?
Przykładowe rozwiązanie
Odp. A. Chodzi o modyfikację listo prostych zwaną odcedzaniem. Patrząc na punkt B wiadomo, że nie będziemy zadawać wszystkich pytań z listy i chcemy znać układ obiektów w kartotece wyszukiwawczej po 5 zadanych pytaniach, dlatego najlepsze do tego celu będzie odcedzanie dynamiczne bądź hiperdynamiczne. Zagrożenia możliwe to w przypadku przeszukiwania tylko 50% KW utrata kompletności odpowiedzi.
Odp. B. Biorąc pod uwagę odpowiedzi na pytania t1,t2,t3,t4 i t5 zmieniamy po każdym pytaniu kolejność obiektów w kartotece wyszukiwawczej tak, że jeśli obiekt był odpowiedzią na pytanie to przechodzi o jedno miejsce w górę kartoteki.
Więc po 5 zadanym pytaniu Kartoteka wyszukiwawcza jest następująca:
Odp. C.
proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B)Zakładając że przeszukujemy tylko 50% kartoteki mamy do przeglądnięcia jedynie następujące obiekty:
X frekwencja Srednia_ocen Liczba_nagród
X1 WYSOKA a C1
X2 NISKA B C3
X3 WYSOKA C C2
X4 NISKA A C3
X5 WYSOKA B C1
X6 NISKA C C3
X7 WYSOKA A C2
X8 NISKA A C3
X9 WYSOKA A C1
X10 NISKA c C3
T0 T1 T2 T3 T4 T5 X1 X1 X1 X1 X3 X3 X2 X3 X3 X3 X1 X1 X3 X2 X4 X2 X5 X2 X4 X4 X2 X5 X2 X4 X5 X5 X5 X4 X4 X5 X6 X7 X7 X8 X7 X8 X7 X6 X8 X7 X8 X7 X8 X8 X9 X9 X9 X9 X9 X9 X10 X10 X10 X10 X10 X10 X6 X6 X6 X6
X frekwencja Srednia_ocen Liczba_nagród
X3 WYSOKA C C2
X1 WYSOKA a C1
X2 NISKA B C3
X4 NISKA A C3
X5 WYSOKA B C1
X8 NISKA A C3
X7 WYSOKA A C2
X9 WYSOKA A C1
X10 NISKA c C3
X6 NISKA C C3
X frekwencja Srednia_ocen Liczba_nagród
X3 WYSOKA C C2
X1 WYSOKA a C1
X2 NISKA B C3
X4 NISKA A C3
X5 WYSOKA B C1
Zatem sprawdzamy kolejno opisy tych obiektów i fakt, czy iloczyn deskryptorów
(frekwencja,wysoka)(średnia_ocen,B) zawiera się w opisie analizowanego obiektu:(frekwencja,wysoka)(średnia_ocen,B) ≤ t
x3(frekwencja,wysoka)(średnia_ocen,B) ≤ t
x1(frekwencja,wysoka)(średnia_ocen,B) ≤ t
x2(frekwencja,wysoka)(średnia_ocen,B) ≤ t
x4(frekwencja,wysoka)(średnia_ocen,B) ≤ t
x5Zatem skoro jedynie w opisie obiektu x5 zawiera się szukany iloczyn deskryptorów zapisujemy nazwę tego obiektu jako znaczenie termu t:
(t) = {x5}
Odp. D: kompletność takiej odpowiedzi systemu wynosi 1 (100%) gdyż wyszukaliśmy wszystkie obiekty relewantne z systemu. Jak do tego dojść ?
Sprawdzamy opisy wszystkich obiektów (a nie jedynie 50%) i szukamy obiektów zawierających w swoim opisie szukany iloczyn deskryptorów. Okazuje się, że w całym systemie jedynie obiekt x5 zawiera taki iloczyn deskryptorów. A zatem, przeglądając jedynie 50% kartoteki wyszukiwawczej uzyskaliśmy kompletną odpowiedź – gdyż wyszukaliśmy wszystko co było do wyszukania.
Zadanie 2
1. Dokonaj modyfikacji metody list prostych zwanej organizacją zwartą. Następnie przedstaw kartotekę wyszukiwawczą dla tej modyfikacji i napisz algorytm słowny procesu wyszukiwania. Omów sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t2. Poniżej przedstawiono reprezentację macierzową relacji: zbiór pytań – zbiór obiektów relewantnych:
t1 t2 t3 t4 t5
x1 1 0 1 1 1 x2 0 1 1 1 0 x3 1 0 1 0 1 x4 1 0 0 0 0 x5 1 0 1 0 0
Odp: Pamiętając, że organizacja zwarta ma na celu takie przeszeregowanie obiektów w którym obiekty stanowiące odpowiedź na pytanie są układane obok siebie w kartotece (stanowią zwarty obszar „jedynek” w takiej macierzy) zmieniamy kolejność obiektów z początkowej (widocznej w macierzy powyżej) na następującą:
t1 t2 t3 t4 t5
x4 1 0 0 0 0 x5 1 0 1 0 0 x3 1 0 1 0 1 x1 1 0 1 1 1 x2 0 1 1 1 0
Obiektom nadajemy nowe uporządkowanie:
x4 1 x5 2 x3 3 x1 4 x2 5
Więc kartoteka wyszukiwawcza będzie następująca:
NU X a b …
1 X4 .. .. ..
2 X5 .. .. ..
3 X3 .. .. ..
4 X1 .. .. ..
5 X2 .. .. ..
Do tego dochodzi tablica adresowa:
t AP AK
t1 1 4
t2 5 5
t3 2 5
t4 4 5
t5 3 4
algorytm słowny procesu wyszukiwania
Jeśli pytanie należy do zestawu pytań, które tworzyły kartotekę (a więc jest to jedno z pytań t1..t5) to szukamy w tablicy adresowej danego termu i pobieramy adres początku AP oraz końca AK bloku obiektów stanowiących odpowiedź na ten term. Następnie pobieramy z kartoteki wyszukiwawczej nazwy obiektów. Jeśli pytanie zawiera w sobie któreś z pytań t1..t5 to także szukamy właściwego termu w tablicy adresowej i to stanowi dla nas odpowiedź przybliżoną. Wybrany blok obiektów od AP do AK należy potem przeszukać w celu sprawdzenia czy pozostałe deskryptory pytania zawierają się w obiektach odpowiedzi przybliżonej. Jeśli pytanie jest spoza zbioru t1..t5 to niestety konieczny jest przegląd zupełny.
sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t
2.
1. Szukamy t2 w tablicy adresowej:
t AP AK
t1 1 4
t2 5 5
t3 2 5
t4 4 5
t5 3 4
2. Pobieramy AP oraz AK:
AP = 5 AK = 5
3. Przechodzimy do Kartoteki wtórnej nowouporządkowanej i pobieramy właściwe nazwy obiektów (w tablicy adresowej mieliśmy do dyspozycji jedynie tzw. Nowe adresy obiektów)
NU X a b …
1 X4 .. .. ..
2 X5 .. .. ..
3 X3 .. .. ..
4 X1 .. .. ..
5 X2 .. .. ..
(t2) = {x2}
Zadanie 3
Dany jest system informacyjny:
Tytuł Rodzaj Reżyser Rok produkcji Budżet Kraj
Pianista Dramat Roman Polański niedawno bardzo wysoki Francja
Twin Peaks: Ogniu krocz ze
mną Dramat David Lynch dawno średni Francja
Donnie Darko Dramat Richard Kelly niedawno średni Stany Zjednoczone
Forrest Gump Dramat Robert Zemeckis dawno bardzo wysoki Stany Zjednoczone
Wywiad z wampirem Horror Neil Jordan dawno bardzo wysoki Stany Zjednoczone
Mulholland Drive Dramat David Lynch niedawno wysoki Francja
Motyl i skafander Dramat Julian Schnabel niedawno wysoki Francja
Efekt motyla Thriller J. Mackye Gruber niedawno wysoki Stany Zjednoczone
Dzień Tryfidów Science-fiction Freddie Francis bardzo dawno niski Wielka Brytania
Wysłannik piekieł Horror Clive Barker bardzo dawno średni Wielka Brytania
Przedstaw kartotekę wyszukiwawczą dla metody list prostych z grupowaniem obiektów wiedząc, że najczęściej padają pytania dotyczące rodzaju filmu. Uzasadnij jak wprowadzone przez Ciebie modyfikacje wpłyną na określone parametry: czas wyszukiwania i zajętość pamięci
? Następnie przedstaw proces wyszukiwania wszystkich bardzo starych.