• Nie Znaleziono Wyników

BADANIE REGUŁ POSTRZEGANIA NATURALNEGO W CELU ICH WYKORZYSTANIA W INTELIGENTNYCH SYSTEMACH WIZYJNYCH

N/A
N/A
Protected

Academic year: 2021

Share "BADANIE REGUŁ POSTRZEGANIA NATURALNEGO W CELU ICH WYKORZYSTANIA W INTELIGENTNYCH SYSTEMACH WIZYJNYCH"

Copied!
4
0
0

Pełen tekst

(1)

BADANIE REGUŁ POSTRZEGANIA NATURALNEGO W CELU ICH WYKORZYSTANIA W INTELIGENTNYCH SYSTEMACH WIZYJNYCH

PIOTR AUGUSTYNIAK, ZBIGNIEW MIKRUT

Katedra Automatyki Akademii Górniczo-Hutniczej, Kraków, {august zibi}@agh.edu.pl

Streszczenie. Referat opisuje prace badawcze maj - ce na celu okrelenie parametrów epizodów składowych procesu pobierania informacji wizyjnej przez system wzrokowy człowieka. System ten sw wysok spraw- no funkcjonaln zawdzicza wystpuj cym naprze- miennie epizodom koncentracji uwagi i inteligentnego poszukiwania informacji. Istnieje zatem uzasadniona nadzieja, e u ycie systemu wzrokowego człowieka jako wzorca dla rozwi za uytych w systemach sztucznej inteligencji przyczyni si do istotnej poprawy ich parametrów. Opisano eksperymenty okoruchowe majce na celu okrelenie postrzeganego zakresu sceny podczas pojedynczego epizodu koncentracji uwagi.

Dodatkowo dokonano oszacowania iloci informacji, która moe zosta odtworzona na podstawie kontekstu, bez potrzeby ponownej zmiany punktu koncentracji uwagi. Otrzymane rezultaty dowodz m. in., e gałka oczna jest słabym przyrzdem optycznym o stosunkowo wskim kcie widzenia. Rezultaty mog by przydatne do dalszej analizy procesu postrzegania, a zwłaszcza czytania, oceny sprawnoci interpretacji obrazów i wreszcie w ocenie poprawnoci funkcjonowania układu okulomotorycznego.

1. WPROWADZENIE

Analiza procesu pobierania informacji przez system wzrokowy człowieka [6] jest niezwykle istotnym czyn- nikiem modelowania procesu pobierania informacji i stwarza nadziej na zaimplementowanie rzdz cych nim reguł w inteligentnych systemach wizyjnych. Sys- temy te, działaj!ce wedle reguł sztucznej inteligencji

zast"puj# coraz cz$%ciej człowieka w zadaniach obser-

wacyjno-interwencyjnych o szczególnej uci&'liwo(ci (np. ci)gła analiza obrazów z kamer, przedstawiaj*cych ruch drogowy). Kolejnym krokiem jest uczynienie z nich funkcjonalnej repliki narz+du wzrokowo- okoruchowego człowieka, wydaje si, zatem naturalne uzupełnienie ich o algorytmy realizuj-ce funkcje inteli- gentnego poszukiwania informacji wizyjnej. Poniewa. postrzeganie sceny realizowane jest przez człowieka pod/wiadomie, a niekiedy z wykorzystaniem nawyków

okulomotorycznych, uzasadnione wydaje si0 badanie reguł postrzegania równie1 bez anga2owania 3wiado- mo4ci obserwatora. Mo5e to by6 dokonane przez akwi- zycj7 i analiz8 9cie:ki wzrokowej, a nast;pnie uogólnie- nie wyznaczonych parametrów do odpowiednich reguł.

Według bada< okulistycznych i oftalmologicznych oko jest bardzo niedoskonałym przyrz=dem wizyjnym, a sprawno>? systemu wizyjnego człowieka jest osi@gana dziAki naprzemiennym procesom pozyskiwania infor- macji, ich analizy i poszukiwania [2, 5].

PoniewaB zainteresowanie kolejnymi informacjami ze sceny jest uwarunkowane subiektywnie, CcieDka wzrokowa moEe byF bardzo skomplikowana. Znacznym ułatwieniem moGe byH serializacja informacji wizyjnej dokonywana przez uIycie tekstu, którego odczytanie jest zdefiniowane przez nastJpstwo liter od lewej do prawej i wierszy od wyKszych do niLszych.

Badania procesu postrzegania opisywane w niniej- szym artykule miały na celu odpowiedM na nastNpujOce pytania:

- jakP porcjQ sceny obserwator postrzega jednoczeRnie?

- jaka jest gSstoTU punktów koncentracji uwagi ko- nieczna do prawidłowej percepcji sceny?

2. MATERIAŁY I METODY

Badania majVce na celu odpowiedW na wyXej sfor- mułowane pytania przeprowadzono metodY dwóch eksperymentów wizualnych (ang. visual task) z uZyciem aparatury rejestruj[cej \cie]k^ okoruchow_ (ang. ey- etracker) Ober-2. Podczas realizacji zada` scena po- strzegana przez obserwatora jest wczeaniej precyzyjnie przygotowana, a analiza trajektorii ruchu gałek ocznych jest dokonywana w kontekbcie zawartocci sceny.

W charakterze obserwatorów wystdpowali wolontariu- sze wyłonieni z grup studenckich (8 osób, 5 kobiet, 3 mefczyzn, grednia wieku 22 lata).

Do rejestracji połohenia gałki ocznej wykorzystano urzidzenie Ober-2 [4], które mierzy moc wijzki pro- mieniowania podczerwonego odbitego od gałki ocznej.

Okwietlacze oraz detektory promieniowania podczer-

(2)

wonego umieszczone sl w goglach zakładanych przez obserwatora (rys. 1), skmd sygnał elektryczny pobierany jest do systemu OBER2 a po przetworzeniu na postan cyfrowo (12 bitów, 500 Hz) dostppny na łqczu komuni- kacji szeregowej w postaci cirgu czwórek liczb, bsdt- cych reprezentacju pozycji centrum kavdego z oczu w osi pionowej i poziomej. Poprawna interpretacja danych pochodzwcych z urzxdzenia jest moyliwa dzizki ustale- niu pozycji obserwatora wzgl{dem prezentowanej sceny (monitora komputerowego) a tak|e kalibracji urz}dze- nia, polegaj~cej na obserwacji prostokta o standardo- wych wymiarach ka€dorazowo przed i po pokazie.

Rys. 1. Fizyczna zasada działania urzdzenia do rejestracji sygnału okoruchowego Ober-2.

2.1 Pokazy ci

‚

gów znaków

Pierwszy z eksperymentów polegał na obserwacji pojawiajƒcych si„ w dowolnych miejscach sceny ci…- gów znaków (0-9,A-Z - por. rys. 2). Eksperyment ten miał na celu zbadanie zale†no‡ci poprawnoˆci rozpo- zna‰ ciŠgu znaków od długo‹ci tego ciŒgu, a take stwierdzenie, jaka długoŽ cigu jest jeszcze obserwo- walna za pomoc‘ jednego epizodu koncentracji uwagi [1, 3]. Zawiera on zarówno aspekt geometryczny (dłu’- szy ci“g zajmuje wi”kszy fragment sceny) jak i infor- macyjny (dłu•szy ci–g zawiera wi—ksz˜ ilo™š informa- cji). Ci›gi znaków były prezentowane w ograniczonym czasie dobieranym z przedziału od 0,1 do 1 [s] tak, aby obserwator nie zdœył wielokrotnie skanowaž sceny, co było kontrolowane za pomocŸ systemu okoruchowego Ober-2.

Rys. 2. Przykład ci gu znaków wy¡wietlanego na ekranie, d jest współrz¢dn£ poziom¤ wzgl¥dem ¦rodka ekranu.

Wst§pna analiza 465 pokazów pozwoliła na ustale- nie reguł interpretacji ¨cie©ek wzrokowych oraz zjawisk zakłócajªcych zale«no¬­ liczby epizodów koncentracji

uwagi od geometrycznego rozmiaru prezentowanej informacji:

- zbyt krótki czas pokazu powoduje, ®e obserwator nie zd¯°y przeanalizowa± zauwa²onej sekwencji znaków i rozpocz³´ poszukiwania brakujµcej cz·ci (w takich przypadkach otrzymywano jeden punkt koncentracji uwagi, a informacja zawarta w dalszej cz¸¹ci ciºgu znaków była zgubiona);

- zbyt długi czas pokazu powoduje, »e obserwator po całkowitym rozpoznaniu prezentowanego ci¼gu znaków zaczyna poszukiwa½ innych interesuj¾cych elementów sceny i ¿cieÀka wzrokowa reprezentuje równieÁ dodatkowe punkty koncentracji uwagi.

2.2 Rekonstrukcja tekstu zniekształconego

Drugi eksperyment polegał na czytaniu tekstu znie- kształconego poprzez losow zamianà liter w obrÄbie wyrazów. Prezentowany tekst zawierał narastajÅcÆ licz- bÇ przestawieÈ (rys. 3) zmuszajÉcych obserwatora do interpolacji zniekształconej informacji, a przy przekro- czeniu okreÊlonego progu - do poszukiwania brakujËcej informacji w kontekÌcie sÍsiednich wyrazów. Progowa wartoÎÏ odsetka przestawionych liter była moÐliwa do okreÑlenie przy pomocy generatora zniekształconego tekstu. Eksperyment umoÒliwiał rejestracjÓ sygnału okoruchowego, a nastÔpnie stwierdzenie, w którym wierszu ÕcieÖka wzrokowa obserwatora traciła charakter jednokierunkowo-skokowy, typowy dla czytania płyn- nego, i zawierała przeskoki i powroty kolejnych punk- tów koncentracji uwagi, zwi×zane z próbami interpreta- cji zniekształconej informacji w szerszym kontekØcie.

Rys. 3. Przykład tekstu zniekształconego. Podczas ekspery- mentu tekst był wyÙwietlany linijka po linijce.

3. REZULTATY

TrudnoÚci z opracowaniem w pełni automatycznego algorytmu interpretujÛcego ÜcieÝkÞ wzrokowß i uwzglàdniajácego powyâsze ograniczenia były przy- czynã manualnej interpretacji äcieåek wzrokowych. Ze zbioru wyników eksperymentów, opisanych w punkcie 2.1, usuniæto çcieèki wzrokowe nie zawierajéce precy- zyjnie zlokalizowanych punktów koncentracji uwagi, a takêe te, dla których czas pokazu był mniejszy nië 500 [ms]. Przyjìty czas uznano za wystarczajícy do dwu- krotnej koncentracji uwagi, jeîli wymaga tego proces postrzegania. W zbiorze pozostałych 245 obserwacji otrzymano wysokï korelacjð iloñci punktów koncentra- cji uwagi z długoòció prezentowanego ciôgu znaków (r Pearsona = 0.5196) oraz niewielkie zaleõnoöci od czasu prezentacji (r = 0.1948) i odległo÷ci prezentowa- nego ciøgu od centrum sceny (r = 0.1627). ùadna úcieû- ka wzrokowa nie zawierała trzech punktów koncentracji uwagi. Prawdopodobieüstwo wystýpienia dwóch punk-

(3)

tów koncentracji uwagi w zaleþnoÿci od długo ci tekstu przedstawia tabela 1.

Tab.1. Prawdopodobiestwo postrzegania cigu znaków za pomoc dwóch epizodów koncentracji uwagi.

długo cigu znaków

kt widzenia

[o]

prawdopodobiestwo wyst - pienia dwóch epizodów

koncentracji uwagi

4 1.77 0.0889

5 2.22 0.3462

6 2.66 0.4000

7 3.11 0.6207

8 3.55 0.6471

9 3.99 0.7407

10 4.44 0.8026

Przykładowe wykresy składowych poziomych cie-

ek wzrokowych przy ograniczonym czasowo rozpo- znawaniu ci gu znaków przedstawia rysunek 4.

Rys. 4. Składowe poziome cieek wzrokowych dla:

a) pojedynczego epizodu koncentracji uwagi b) dwóch epizo- dów koncentracji uwagi.

W drugim eksperymencie (por. pkt 2.2) parametry



cieki wzrokowej były opisywane przez rónice prd- koci i kierunku w osi poziomej. Graniczny odsetek przestawionych liter wyraa maksymalny interwał, w którym obserwatorowi łatwiej jest interpolowa znie- kształcon informacj ni poszukiwa jej z uyciem systemu wizyjnego. Wybór ten jest oczywicie doko- nywany podwiadomie i zaley od cech osobniczych.

Sporód 288 pokazów linii tekstu zniekształconego zawierajcych rednio 74.7 ±9.2 znaków zidentyfiko- wano 62 sytuacje powrotu (przesuni!cia w lewo) punktu koncentracji uwagi. Przyj"to nast#puj$ce kryteria:

- obie gałki oczne musz% wykona& ruch powrotny, - ruch powrotny wyst'puje po rozpocz(ciu skanowa-

nia linii tekstu i przed zako)czeniem (ruchy po- wrotne styczne do granic tekstu nie były brane pod uwag*),

- długo+, skoku powrotnego wyra-ono jako ułamek całkowitej długo.ci /cie0ki wzrokowej w płasz- czy1nie poziomej, a zatem do długo2ci tekstu.

Na rysunku 5 przedstawiono przykładowe wykresy składowych poziomych 3cie4ek wzrokowych, zareje- strowanych podczas obserwacji jednej linijki tekstu.

Długo56 ruchu powrotnego stanowiła 7rednio 10.95% długo8ci 9cie:ki wzrokowej (±6.44%). Zatem bior;c pod uwag<, =e >cie?ka wzrokowa zawiera @rednio 12.8 punktów koncentracji uwagi na odczytywanym tekAcie sformułowano nastBpujCce wnioski:

- niepowodzenie interpolacji tekstu powoduje powrót koncentracji uwagi do znanego fragmentu, - Drednia iloEF liter przypadajGca na punkt koncentra-

cji uwagi wynosi 5.8359 i jest nieco mniejsza niH w przypadku pokazów izolowanych ciIgów znaków.

4. DYSKUSJA

Przeprowadzone eksperymenty i analiza otrzyma- nych JcieKek wzrokowych pozwoliły na udzielenie od- powiedzi na pytania, sformułowane we wprowadzeniu:

- porcja tekstu widziana podczas pojedynczego epi- zodu koncentracji uwagi jest wiLksza niM skok gałki ocznej – Nrednia odległoOP punktów koncentracji uwagi stanowi zatem dolne oszacowanie porcji in- formacji pobieranej ze sceny,

- porcja tekstu moQliwa do interpolacji bez angaRo- wania systemu okulomotorycznego do poszukiwaS kontekstowych jest mniejsza niT Urednia odległoVW pomiXdzy punktami koncentracji uwagi podczas powrotu.

Przeprowadzone eksperymenty wykazały takYe silnZ zale[no\] parametrów ^cie_ki wzrokowej od cech osob- niczych. Niektórzy obserwatorzy postrzegali znacznie wi`ksze porcje tekstu podczas pojedynczego epizodu koncentracji uwagi.

Przeprowadzono takae próby głobnego czytania zniekształconego tekstu, co miało na celu biecdce wery- fikacjf poprawnogci interpolacji zniekształconej infor- macji. Okazało sih jednak, ie głojna wymowa powodu- je znacznk niestabilnolm pozycji głowy i w konsekwen- cji zniekształcenie rejestrowanej ncieoki wzrokowej.

b) a)

(4)

Zastosowanie wyników analizy pobierania informa- cji wizyjnej przez człowieka otwiera mopliwoqci znacz- nego rozszerzenia pojrcia interaktywnosci mediów informacyjnych. Jako przykłady pomysłów wartych dalszego rozwijania podat mouna:

- hipertekst rozwijany w zalevnowci od koncentracji uwagi czytelnika na wybranym wyrazie,

- tekst inteligentny, w którym trexy kolejnych wy-

z

wietlanych wierszy jest uzale{niona od parame- trów |cie}ki wzrokowej czytelnika,

- interaktywny pokaz wizyjny (informacyjny, eduka- cyjny lub rozrywkowy), w którym celowa modyfi- kacja tre~ci kieruje uwag obserwatora.

PODZI

€

KOWANIA

Opisywane prace badawcze były finansowane przez Akademi Górniczo-Hutnicz‚ w Krakowie, nr umowy:

11.11.120.249. Autorzy wyraƒaj„ swe podzi…kowania studentom: Łukaszowi Chornikowskiemu, Łukaszowi Czajczykowi, Przemysławowi Koprowskiemu oraz Franciszkowi Korcie za zaanga†owanie i kreatywno‡ˆ.

LITERATURA

[1] Augustyniak P., Mikrut Z.: Lokalizacja istotnych cech obrazu metod‰ Šledzenia ‹cieŒki wzrokowej, XIII Krajowa Konferencja Biocybernetyka i In y- nieria Biomedyczna, 931-936, Gdask 2003.

[2] Boccignone G.: An Information-theoretic Approach to Active Vision, 11th International Conference on Image Analysis and Processing ICIAP, 2001.

[3] Mikrut Z., Augustyniak P.: Estimation of Execution Time for Tasks of Objects Counting and Localiza- tion Using the Ober2 Device, IFMBE Proc. 2: 144- 145, Reykjavik 2002.

[4] Ober J., Hajda J., Loska J., Jamicki M.: Applica- tion of Eye Movement Measuring System OBER2 to Medicine and Technology, SPIE, Infrared tech- nology and applications 3061(1):327-333, Orlando, USA, 1996.

[5] Pelz J. B., Canosa R.: Oculomotor behavior and perceptual strategies in complex tasks, Vision Re- search 41:3587-3596, 2001.

[6] Yarbus A. F.: Eye Movements and Vision, New York, Plenum Press, 1967.

Rys. 5. Składowe poziome Žcieek wzrokowych: a) cie‘ka wzrokowa o charakterze jednokierunkowo-skokowym b) ’cie“ka wzrokowa z powrotami koncentracji uwagi (sytuacje powrotu oznaczono okr”gami).

b) a)

Cytaty

Powiązane dokumenty

obecnych transformacji instytucji uniwersytetu w Europie to presje globalizacyjne wywierane na państwa narodowe i gwa- rantowane przez nie usługi publiczne; presje europeizacyjne,

10 J.. szczegółowych studiów analitycznych. Zmieniła się w sposób istotny sama metodologia badań. Zasadą obowiązującą stał się marksistowski postulat traktowania

Wiele uszkodzeń trójfazowej maszyny indukcyjnej może być modelowanych jako odpowiednie powiększenie rezystancji części uzwojenia, przy czym pod- czas eksploatacji może

Wraz z rozwojem takich dziedzin jak zarządzanie wiedzą, eksploracja danych czy odkrywanie wiedzy nastąpiło przejście od wizualizacji informacji (informa- tion visualisation)

„Socjalistyczny terytorializm”, głoszony przez działaczy ICOR, przed- stawiano jako alternatywę wobec terytorializmu syjonistycznego, ale radykalna opozycja

Istnieje również różnica pomiędzy „tekstem ”, którym zajmuje się języko­ znawstwo, a „tekstem ”, który stanowi przedmiot analizy tekstologicznej. Teksto-

 Najważniejszym wymaganiem dla analiz ruchów gałek ocznych jest identyfikacja fiksacji, sakkad i ruchów śledzenia.  Zakłada się, że ruchy te są dowodem na zależną od

initially completely filled with oil, and to determine the leak rate. The mathematical model is predictive and takes account of various relevant effects, such as those of friction