Pytania:
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list prostych bez modyfikacji. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
W metodzie list prostych informacje o obiektach systemu S są pamiętane w dowolnej kolejności (np. w kolejności napływania informacji). Informacja o obiekcie ρx jest iloczynem deskryptorów po wszystkich atrybutach systemu: t x
= (a1,v1) * (a2, v2), ..., (an, vn), (ai𝜖 A , v t 𝜖 Vai, n — liczba atrybutów systemu).
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list prostych z modyfikacją polegającą na grupowaniu obiektów wg. Wybranego atrybutu. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
Spośród zbioru atrybutów A systemu S wybieramy atrybut ai i porządkujemy tak opisy obiektów, aby w opisach tych atrybut ai znajdował się na pierwszym miejscu. Następnie grupujemy obiekty o jedna kowej wartości vj
atrybutu tak że: 𝑋𝑣𝑗 = {𝑥 𝜖 𝑋, 𝜌𝑥(𝑎𝑖) = 𝑣𝑗,𝑣𝑗 𝜖 𝑉𝑎𝑖}.
Oczywiście tak otrzymane zbiory Xv j są rozłączne, a ich suma daje pełny zbiór X. Dzięki takiemu zgrupowaniu obiektów dla większości odpowiedzi wystarczy dokonać przeglądu zupełnego tylko w wybranej grupie Xv j.
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list prostych z modyfikacją polegającą na podziale połówkowych. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
Metoda ta jest stosowana przede wszystkim dla atrybutów numerycz nych, tzn. takich, których wartości są liczbami naturalnymi. Metoda ta może być jednak stosowana również dla innego rodzaju atrybutów, jeś li wartości tych atrybutów w opisach obiektów (deskryptory) przedstawione zostaną w postaci kodów numerycznych. Ponieważ wartości atrybutów są liczbami naturalnymi, wobec tego opisy obiektów można przedstawić w po staci ciągu liczb naturalnych. Ciągi te porządkujemy w kolejności rosnącej lub malejącej i numerujemy kolejnymi liczbami naturalnymi od 1 do r. Term składowy ti pytania przedstawiamy również w postaci ciągu liczb natural nych. Porównujemy term składowy ż, pytania z opisem obiektu w połowie bazy da nych (x[𝑟2]) Można podać algorytm wskazujący, w której
„połowie” zbioru obiektów znajduje się obiekt, zawierający w opisie term składowy ti.
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list inwersyjnych bez modyfikacji. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
Tworzymy listy adresów tych obiektów, które w swoim opisie zawierają deskryptor di (di, ∈ tx). Listy takie nazywać będziemy listami inwersyjnymi i oznaczać będziemy 𝛼(𝑑𝑖): 𝛼(𝑑𝑖)= { n1,...,nm}, gdzie: 𝑑𝑖= (𝑎𝑖, 𝑣𝑖), 𝑎𝑖 ∈ 𝐴, 𝑣𝑖 ∈ 𝑉𝑎𝑖
Tworzymy tyle list inwersyjnych, ile w systemie występuje deskrypto rów di.
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list inwersyjnych ze
zmniejszonym zbiorem list inwersyjnych. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z
czego się ona ostatecznie składa.
Listy inwersyjne w tej metodzie tworzymy nie dla wszystkich deskryp torów występujących w opisach obiektów, a dla pewnego podzbioru D' ⊂ D tych deskryptorów. Wybrany zbiór D' może być zbiorem deskryptorów najczęściej występujących w pytaniach do systemu S lub zbiorem deskryptorów pewnego atrybutu (pewnych atrybutów) - patrz modyfikacje metody list prostych. W omawianej modyfikacji tworzymy listy inwersyjne α(di), gdzie
𝑑𝑖 ∈ 𝐷′ 𝑖 ⋃ 𝑑𝑖 𝑖
= 𝐷′
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list łańcuchowych. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
W metodzie list łańcuchowych obiekty umieszczone są w pamięci tylko raz.
Dla przyspieszenia wyszukiwania tworzy się w pamięci maszyny cyfro wej dodatkowo tzw. tablicę zakotwiczeń.
Tablica ta dla każdego deskryptora di podaje adres początku łańcucha i długość łańcucha (liczbę elementów łańcucha) 𝑡𝑎𝑏(𝑑𝑖) = (𝑛1, ℒ(𝑑̿̿̿̿̿̿̿) 𝑑𝑙𝑎 𝑑𝑖) 𝑖 ∈ 𝐷, gdzie: 𝑛1= 𝜇(𝑥1𝑖)
U wag a. Zwykle odsyłacze umieszczone są bezpośrednio przy każdym deskryptorze w opisach obiektów. W pamięci oprócz obiektów z odsyłaczami umieszczamy tylko tablicę zakotwiczeń (łańcuchy oddzielnie nie są zapamiętywane).
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie Saltona. Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
Opisy obiektów pogrupowane są w bazie danych w grupy Xi, ( i = 1,..., m), przy czym spełniony jest warunek:
𝑋 = ⋃ 𝑋𝑚 𝑖
𝑖 . Każda grupa Xi poprzedzona jest identyfikatorem grupy, który jest nazy wany centroidem (Ci) lub profilem Pi. 𝑋𝑖= (𝐶𝑖, {𝑡𝑥𝑖}).
Grupowanie obiektów w grupy może odbywać się wieloma metodami. Naj częściej stosowanymi są metoda Rocchia i metoda Doyle’a. Przy grupowaniu metodą Rocchia wybieramy obiekt, stanowiący tzw. centrum grupy, liczymy współczynniki podobieństwa każdego obiektu z centrum grupy, wy bieramy minimalny zbiór opisów obiektów {𝑡𝑥𝑖}𝑚𝑖𝑛 o najwyższym współczynniku podobieństwa z centrum grupy. Centroid tworzymy jako i loczyn deskryptorów występujących w wybranym zbiorze {𝑡𝑥𝑖}𝑚𝑖𝑛 opisów obiektów: 𝐶𝑖= (∏ 𝑑𝑖 𝑖 ∈ 𝐷, 𝑑𝑖 ∈ {𝑡𝑥𝑖}𝑚𝑖𝑛) , gdzie: D - zbiór deskryptorów systemu S . Profil jest odpowiednikiem centroidu będącym kodem numerycznym grupy (ewentualnie numerem grupy), a tworzonym w grupowaniu algorytmem Doyle’a.
Proszę powiedzieć, z czego składa się kartoteka wyszukiwawcza w metodzie list składowych atomowych.
Proszę nie omawiać procesu zakładania kartoteki, a jedynie to z czego się ona ostatecznie składa.
Dla stworzenia dogodnej kartoteki wyszukiwawczej wprowadzamy nu merację składowych atomowych. Pamiętamy, że opisy składowych atomowych stanowią, iloczyny wartości z każdego atrybutu. W bazie danych systemu wystarczy pamiętać numery składowych atomowych i odpowiadające im zbiory obiektów.