FIZYCZNE STRUKTURY DANYCH - Informatyka Nr 4; Organ Komitetu Informatyki, Ministerstwa Nauki,

N ajogólniej rzecz biorąc, przez stru k tu rę rozum ie się zestaw elementów i ich powiązań.

Logiczna stru k tu ra danych w yrażana je st w postaci ze

staw ów inform acji reprezentujących p u nkt widzenia użyt

kownika. Elem entam i stru k tu ry logicznej są dane (zwykle na poziomie zapisu), powiązane określonym i relacjam i.

Zestaw em logicznym może być, na przykład, grupa zapisów: zamówienie, odbiorca, wyrób, połączonych taką wspólną cechą jak sym bol wyrobu. Elem enty zestawu lo

gicznego są więc wskazyw ane przez powiązania logiczne (np. klucze lub odsyłacze adresowe) i mogą pochodzić z różnych zbiorów fizycznych. W ystępowanie logicznych s tru k tu r danych jest istotną cechą baz danych.

Przez fizyczną stru k tu rę danych rozumie się układ w p a

mięci kom putera w yrażany w postaci takich kom ponen

tów, jak:

— zbiór fizyczny, czyli najw iększa jednostka danych z punktu w idzenia system u operacyjnego

— blok, ciyli porcja przesianych danych pomiędzy u rzą

dzeniem w ejścia-w yjścia i pam ięcią operacyjną

— zapis, czyli porcja danych rozpatryw ana jako całość z p u nktu widzenia instrukcji czytania-pisania w progra

mie użytkowym

— segm ent fizyczny zapisu, czyli ciąg kolejnych pól za

pisu, obsługiw any jako jednostka danych przez system zarządzania bazą danych, odpow iadający zapisowi zbioru klasycznego

— agregat danych, czyli pole grupowe identyfikow ane adresem początku lub końca pola i jego długością

— pozycja, czyli pole elem entarne (najm niejsza jednostka danych identyfikow ana poprzez adres b ajtu lub znaku po

czątku albo końca pola i jego długość)

— b ajt lub znak, czyli najm niejsza jednostka pamięciowa identyfikow ana poprzez adres

— bit, czyli elem entarna część bajtu (lub znaku), służąca do odw zorow ania w artości „bitowej” 0 lub 1.

W klasycznym system ie form aty i kolejność pól dekla

row ane są w program ach użytkowych, co oznacza, że po kom pilaoji (po zam ianie nazw na adresy) nab ierają one sztywnego ch arak teru i każda zm iana stru k tu ra ln a w y

m aga zmian program owych. Zrealizowanie koncepcji w y

dzielenia zapisu danych poza program do specjalnego zbioru, zwanego zwykle słownikiem danych lub schematem, nastąpiło poprzez oprogram ow anie system ów zarządzania bazą danych. W w arunkach banku danych możliwe są pewne (zależnie od pakietu) zm iany opisowe i przesunię

cia stru k tu raln e bez m odyfikacji program ów użytkowych.

Możliwości powyższe określa się jako zabezpieczenie nie

zależności danych od program ów użytkowych (data inde- pendence).

N ajwiększy efekt zastosowań zrealizowanych w techno

logii banku w stosunku do wcześniejszych technologii daje

„żonglowanie” stru k tu rą logiczną. Polega ono na elastycz

nym dobieraniu takich logicznych zestawów danych, które się sk ład ają wyłącznie z danych niezbędnych do realizacji określonego zadania. Program użytkowy operuje więc na

stosunkowo , prostych układach danych, zaś system zarzą

dzania bazą danych w ykonuje skom plikow ane czynności związane z udostępnieniem danych, adresow aniem pow ią

zań, dokonując konw ersji stru k tu r logicznych na fizyczne (i odwrotnie). W efekcie te same dane mogą w ielokrotnie wchodzić do różnych zestawów logicznych, w ystępując ty l

ko raz w stru k tu rach fizycznych.

P ierw otne ukierunkow anie system ów na stru k tu ry fi

zyczne w ynika z tego, że podobnie jak ręczne systemy ew idencyjne, odw zorowują one głównie zew nętrzne (do

kum entacyjne) oznaki zjaw isk gospodarczych, co przejaw ia się w prostym układzie rejestracyjnym , w którym zapis (rekord) odpow iada dokum entowi źródłowemu lub zesta

wieniu. Oznacza to, że stru k tu ra fizyczna jest równocześ

nie sposobem kum ulow ania danych dla określonego prze

kroju ewidenćyjno-sprawozdawczego. Usztywnienie układu danych w pływ a ujem nie na odwzorowanie zjaw isk gospo

darczych, które przejaw iają się w w ielostronnym pow ią

zaniu zdarzeń (patrz rys. 1).

ZMIl zrno

R y s. 1. P o d s t a w o w e p o w i ą z a n i a i n f o r m a c y j n e w z a r z ą d z a n i u p r z e d s i ę b i o r s t w e m p r z e m y s ł o w y m

P R O B L E M A T Y K A B A Z Y D A N Y C H

Nie wszystkie zjaw iska i ' zdarzenia zostają uwzględnione podczas analizy i projektow ania system u. Zapotrzebowanie na inform acje pojaw ia się zwykle przy pow staniu określo

nej sytuacji produkcyjnej, zaopatrzeniowej, kadrow ej, itp.

Wówczas uzew nętrznia się możliwość określenia zakresu potrzebnych inform acji, danych źródłowych, powiązań in form acyjnych i algorytm ów przetw arzania. Ponieważ sy

tuacje powyższe mogą być niepow tarzalne a term in do

starczenia niezbędnych inform acji jest zw ykle krótki, k la

syczne metody budowy system u okazują się mało przydatne i zbyt kosztowne. Rozwiązanie polegać może na zabezpie

czeniu możliwości w prow adzania zmiennych pow iązań in form acyjnych i sukcesywnej rozbudowy lub re stru k tu ra li

zacji zbiorów maszynowych. Pod uwagę należy rów nież wziąć prognozowanie w artości inform acji. Zadanie obsługi procesów decyzyjnych jest bowiem o tyle trudne, że o ile decyzja dotyczy przyszłości, to dane w zbiorach opisują przeszłość. Prognozowanie wym aga z reguły użycia odpo

wiednich modeli zjaw isk gospodarczych. Algorytmy m ode

lowe obejm ują m. in. powiązania zaburzeń n a poziomie zasobów (ściśle mówiąc, ich kluczy) i atrybutów . Pow ią

zanie kluczy dotyczy np. m ateriału i wyrobu, który z niego pow staje. A trybutam i zdarzeń są np. cel, miejsce, spraw a, data, skutek (dane ilościowo-wartościowe), przy

czyna, spraw ca zdarzenia (rip. dostawca). K lasyfikacja zasobów" (obiektów ). jest zm ienna, zależnie od powiązań.

Ten sam elem ent może być w jednym przypadku atry b u tem (np. spraw cą w zamówieniu lub dostawie), zaś w in nym — obiektem (np. w płatności). Musi to być uwzględ

nione w budowie logicznych stru k tu r danych, m. in. przez stosowanie łańcuchow ania danych i" techniki inw ersyjnej.

Metody w iązania danych prow adzą nas do podstawowego zagadnienia, jakim są typy stru k tu r danych.

TYPY LOGICZNYCH STRUKTUR DANYCH

Logiczne stru k tu ry danych mogą być tworzone w ' roz

m aity sposób, zależnie od konkretnych rozwiązań pakie

towych. Podstaw ow e typy stru k tu r przedstaw ione są na rysunkach 2—7. Oznaczenia elem entów strukturalnych na tych rysunkach naw iązują do przykładu powiązań infor

m acyjnych podanych na rys. 1.

W strukturze liniowej (rys. 2) każdy elem ent je st po

wiązany w zasadzie tylko z sąsiednimi elem entam i

(po-M E 1 ME2 ME3 HEL MES

o — —o — o ---o -o

R y s . 2. S t r u k t u r y l i n i o w e

a ) S t r u k t u r a l i n i o w a p r o s t a ( l i s t a p r o s t a ) M E — m a t e r i a ł y i . e l e m e n t y z k o o p e r a c j i

b) S t r u k t u r a l i n i o w a z ło ż o n a h i e r a r c h i z o w a n a ( s t r u k t u r a l i s t u j ą c a ) — w a r i a n t y 1, 2 i 3

D S — d o s t a w c y

R W — r e k l a m a c j e w y s ł a n e Z W - z a m ó w i e n i a w y s ł a n e

D M — d o s t a w y m a t e r i a ł ó w i e l e m e n t ó w z k o o p e r a c j i

O — o --- - o O - c

001 002 OD3 ODL 0D5

c) S t r u k t u r a l i n i o w a z a m k n i ę t a ( p i e r ś c i e n i o w a ) O D — o d b i o r c y

przednim i następnym ), przy czym każdy elem ent jest rów nopraw ny. Liczba elem entów może być powiększona w strukturze listowej (listującej), której elem entam i mogą być listy (podlisty). Można wprowadzić częściową h ie ra r

chizację listy, jeśli jej elem enty traktow ane są jako n ad rzędne w stosunku do podlisty.

W stru k tu rach hierarchicznych (rys. 3) elem enty rozło

żone są według grafu drzewa, rozpoczynając od elem entu początkowego, który nie jest podporządkow any żadnem u innem u elementowi. Pozostałe elem enty łączy relacja nad

rzędności i podrzędności, przebiegająca ściśle w edług grafu.

R y s . 3. S t r u k t u r a h i e r a r c h i c z n a W — w y r o b y

Z — z e s p o ły

E — e l e m e n t y (c z ę ś c i) M — m a t e r i a ł y

U w a g a : p r z e z p o w t a r z a n i e e l e m e n t ó w w s p ó l n y c h ( n p . E2) u z y s k u j e m y s t r u k t u r ę p s e u d o s i e c i o w ą .

Z reguły nie ogranicza się liczby węzłów (poziomów hie

rarchicznych) i liczby elem entów wychodzących z węzła.

Specyficzną właściwością stru k tu r hierarchicznych jest to, że każdy elem ent może mieć pow iązania z wieloma ele

m entam i na niższym poziomie, lecz w stosunku do niego samego może występow ać tylko jeden elem ent nadrzędny.

Właściwość ta nie odnosi się do elem entu początkowego.

W stru k tu rach sieciowych (rys. 4) teoretycznie każdy elem ent może być powiązany z każdym. S truktury takie nazyw am y swobodnymi. W praktyce stru k tu ry sieciowe podlegają pewnym ograniczeniom. Na przykład, w pakie

cie IMS (Inform ation M anagem ent System) budow ane są poprzez łączenie cząstkowych stru k tu r hierarchicznych, przy czym funkcję łącznika spełniają odsyłacze adresowe zastępujące określone węzły stru k tu r cząstkowych. Dzięki odsyłaczom adresow ym (którym i są zwykle ścieśnione adresy dyskowe) możliwe jest otrzym anie wielu stru k tu r logicznych z różnych fizycznych drzew, nie powodując pow tarzania segmentów.

W ograniczonych stru k tu rach sieciowych pow iązania są wyznaczane przez wskazanie określonych zapisów lub zbio

rów. Łączy je zwykle stosunek nadrzędności-podrzędności, z tym, że nie jest zawężany do poziomów wyznaczonych grafem drzew a i sprowadza się do relacji binarnych (po

między dwoma elementami). Zbiór zapisów nadrzędnych określany jest jako MASTER, zaś zbiór rekordów pod

porządkow anych jako CHAIN. W yszukiwanie inform acji może rozpocząć się od dowolnego rekordu dowolnego zbio

ru MASTER i przejść do określonych zbiorów CHAIN, w skazanych przez odsyłacze (więzi) adresowe. W stru k - a turach sieciowych DBTG-CODASYL ’) w yróżnia się ze

staw (zbiór) logiczny SET, którym jest opatrzony nazw ą typów rekordów opisany w schem acie DDL (Data

De-l) D B T G -C O D A S Y L — g r u p a r o b o c z a D a t a B a s e T a s k G r o u p w o r g a n i z a c j i C O D A S Y L ( C o n f e r e n c e o n D a t a S y s t e m s L a n g u a g e s), p o w o ł a n e j w 1S59 r o k u w U S A w z w i ą z k u z o p r a c o w y w a n i e m j ę z y k a C O B O L .

35 P > i t & R L E M A T V K A B A Z V D A H / Y C H

Wektor danej 1

Wektor danej 2 1

\Lp.

l ..

Wektor k lu c z a symbol wyrobu 1 1

I 2

512562 I 3

I ¿ i s i 6

Hfektor oowiozon scription Language) przez SET ENTRY. W celu odróżnie

nia tego pojęcia od terminu „data set” stosowanego w systemie operacyjnym OS firmy IBM będziemy tutaj uży

wać określenia DBTG-SET.

Stosowanie ograniczonych struktur sieciowych wynika niewątpliwie z faktu, że utrzymywanie swobodnego mo

delu sieciowego było niezwykle złożone i maszyno chłonne.

Jeśli przyjmiemy za J. W. Forresterem, że w modelach zarządzania przedsiębiorstwem występuje od 30 do 3000 zmiennych, daje to od 1760 do ok. 18 000 000 dwukierun

kowych powiązań sieciowych. Dalej, jeśli za D. W. Apple- tonem [1] przyjmiemy, że większość decyzji podejmowa

nych w przedsiębiorstwie opiera się na informacji wpro

wadzonych z 400 do 800 danych elementarnych, daje to co najmniej 1053411259X10669 potencjalnych informacji.

Jako kontrpropozycję w stosunku do struktur siecio

wych, w latach 1970—1971 E. F. Codd opracował relacyjny model danych. W strukturach relacyjnych baza danych opi

sywana jest poprzez znormalizowane relacje tablicowe notacji języka SQUARE; przykład relacji przedstawiony na rys. 5 można opisać następująco: PLAN (WYRÓB, ZAMÓWIENIE, PLPROD, PLSPRZED). Ze względu na

powiązania i dostawcami

P rzykbd tablicy re la c ji

c) S ie ć c z ą s t k o w y c h s t r u k t u r w g k o n c e p c j i C O D A S Y L U

DBTG-SET ma następujące właściwości:

— dowolna liczba zestawów logicznych' może być zdefinio

wana w bazie

— zestaw musi mieć pojedynczy typ zapisu OWNER

— w zestawie obowiązuje określony porządek (SET OR

DER)

— typ rekordu może być określony jako OWNER w jed

nym lub więcej zestawach

— typ zapisu może być określony jako MEMBER w jed

nym lub więcej zestawach

— typ zapisu może być zarówno OWNER jak i MEMBER, ale w różnych zestawach (nie może to mieć miejsca w jednym zestawie).

R y s . 4. S t r u k t u r y s i e c i o w e

W E — w y r o b y i e l e m e n t y w y r o b ó w Z M — z a m ó w i e n i a o t r z y m a n e P T — p o z y c j e p o r t f e l u z a m ó w i e ń Z P — z l e c e n i a p r o d u k c y j n e

P S — p o z y c j e p l a n ó w p r o d u k c j i i s p r z e d a ż y P Z — p o z y c j e p l a n u z a o p a t r z e n i a

W S — w y s y ł k a w y r o b ó w i e l e m e n t ó w w y r o b ó w O D — o d b i o r y

Z O — z a p ł a t y o t r z y m a n e O D — o d b i o r c y

a ) S w o b o d n a s t r u k t u r a s i e c i o w a

b ) S i e ć c z ą s t k o w y c h s t r u k t u r h i e r a r c h i c z n y c h w g k o n c e p c j i IM S

R y s . 5. S t r u k t u r a r e l a c y j n a ( t a b l i c e r e l a c j i )

bezpośrednie odwołani^ do wartości elementów kolumn (zwanych domenami)^" każda z nich musi być opatrzona unikalnym identyfikatorem. Ponadto znormalizowana ta

blica powinna spełniać warunki:

— nie jest wymagane uporządkowanie kolumn i wierszy

— wszystkie wiersze są różne (pod względem wartości)

— wszystkie elementy kolumny są tego samego typu

— każdy element tablicy jest polem elementarnym

— ze względu na zależności „jeden-do-jeden” w tablicy nie mogą znajdować się grupy powtarzalne Crepeating groups), elementy same będące relacjami oraz elementy zależne tylko od części klucza lub zależne od innych elementów niż klucze.

Dzięki normalizacji otrzymujemy stosunkowo prostą (zwo

lennicy struktur relacyjnych twierdzą, że najprostszą) strukturę, dogodną dla operacji zasilania i wyszukiwania.

Ponadto wprowadzenie nowych relacji do bazy nie w pły

wa na istniejące już tablice, jednakże może powodować redundancję (powtarzanie) danych. Pod względem liczby wdrożeń pakietowych struktury relacyjne znacznie ustę

pują strukturom zaproponowanym przez CODASYL.

Struktury wektorowe (rys. 6) — zastosowane m. in. w pakiecie ROBOT, opracowanym przez firmę SOFTWARE SCIENCES — stanowią przewrót w technologii przetwa

rzania danych, zakładając odejście od powszechnie

uzna-R y s . 6. S t r u k t u r a w e k t o r o w a ( p r z y k ł a d ) nazwa wyrobu

odkurzacz alfa

36 P R O B L E M A T Y K A B A Z Y D A N Y C H

nej jednostki fizycznej danych, jaką jest zapis (rekord) n a rzecz ciągu w artości jednej danej, zwanego w ektorem . Zbiór zapisów zam ieniany jest („cięty” pionowo) na szereg wektorów, wśród których w ystępuje w ektor identyfikacyj

ny (przechowujące klucze) oraz w ektory danych. W za

jem ne podporządkow anie w ektorów odbyw a się poprzez względną pozycję elem entu (nr kolejny), według której można z pow rotem odtworzyć zapis konw encjonalny. Do tw orzenia stru k tu r logicznych służą w ektory powiązań (link vector), utrzym yw ane przez oprogram ow anie pakietu na podstaw ie deklaracji w skazujących na poła (wektory danych lub w ektor klucza), według których organizowane są powiązania.

Struktury inwcrsyjnc (rys. 7) polegają na tw orzeniu w tórnych zbiorów (wtórnych w stosunku do bazy danych),

R y s . 7. S t r u k t u r y i n w c r s y j n e

a ) S t r u k t u r a i n w e r s y j n a ( o d w r ó c o n a ) z w y k ł a

b) S t r u k t u r a o d w r ó c o n a l i s t u j ą c a

spełniających rolę skorowidzów pośredniczących w w y

szukiw aniu inform acji. Zbiory te um ożliw iają dostęp do bazy danych na " podstaw ie wartości pól elem entarnych (nie będących kluczami), zwanych desjjryptoram i, dostar

czając klucze lub adresy dyskowe zapisów bazy danych.

Na przykład, deskryptoram i mogą być wartości określa

jące znajomość języka angielskiego. K artoteka inw ersyjna może dostarczać num ery ew idencyjne pracow ników zna

jących biegle język angielski. Dla deskryptorów i dla ad re sów tworzone są zwykle odrębne zbiory maszynowe. W zwykłej stru k tu rze inw ersyjnej, w zbiorze inw ersyjnym , przechow yw ane są w szystkie adresy, zaś w stru k tu rze li

stującej jed y n ie początkowe adresy list organizowanych w bazie danych. Ponadto rozróżnia się pełne i cząstkowe zbiory inw ersyjne. Pełne zbiory pokryw ają całą zaw ar

tość bazy danych (każde pole jest deskryptorem ). D aje to możliwość odtw orzenia bazy danych w przypadku jej znisz

czenia, pow oduje jednak bardzo znaczne nakłady pam ię

ciowe, w ielokrotnie większe niż sama baza danych. W p ra k tyce preferow ane są zbiory cząstkowe (zwykle stosowane dla atry b u tó w o niskim stopniu rozpowszechnienia w za

pisach bazy — w bazie inform acji kadrow ych cechą taką są np. odznaczenia państwowe, dla których sekw encyjne przeszukiw anie bazy byłoby nieracjonalne).

UTRZYMYWANIE I DOBÓR STRUKTUR DANYCH

W dokumencie Informatyka Nr 4; Organ Komitetu Informatyki, Ministerstwa Nauki, Szkolnictwa Wyższego I Techniki Oraz Komitetu Naukowo-Technicznego NOT DS. Informatyki - Digital Library of the Silesian University of Technology (Stron 36-39)