• Nie Znaleziono Wyników

Przygotowanie formularzy O M R

Przygotowanie odpowiednich formularzy OMR zdeterminowane jest możliwościami całego systemu, zarówno pod względem sprzętowym akwi­ zycji danych jak i programowym obróbki skanowanych dokum entów i ich rozpoznawania.

W efekcie działania systemu oczekujemy odpowiedzi na pytanie - które z pól wyboru zostało zaznaczone (skreślone, podkreślone, obrysowane itp.)? Aby na nie odpowiedzieć niezbędna jest prawidłowa ich lokalizacja na obra­ zach. Z tego też względu większość formularzy OMR zawiera specjalne m ar­ kery na podstawie których znajdywane są pola wyboru oraz możliwa jest ko­ rekta odkształceń perspektywicznych i soczewkowych jeśli takie występują.

M arkery mogą być rozlokowane w dowolnym miejscu, ale zwykle umiesz­ czamy je w narożnikach formularza. Ich liczba nie powinna być mniejsza od czterech. W celu ewentualnej korekty orientacji skanu jeden m arker może być innego kształtu niż pozostałe (prawy dolny m arker na rys. 19a). Na­ leży pamiętać, aby w okolicach bliskich m arkerów nie umieszczać innych informacji, czy pól wyboru. Z praktyki wiadomo, że niezbyt doświadcze­ ni projektanci takich systemów często o tym zapominają i narażają przy­ szłego użytkownika na wysokie koszty związane z korektą źle przetworzo­ nych dokumentów. Projektując form ularz powinno się dążyć do tego, aby pola wyboru były od siebie na tyle oddalone, aby zminimalizować ryzyko ich przypadkowego zakreślenia. Istnieje kilka sposobów na przygotowanie form ularzy OMR. Ich forma oraz różnorodność pól wyboru zależą przede wszystkim od stopnia zaawansowania m odułu rozpoznawania obrazu. For­ mularze mogą być generowane przy pom ocy dedykowanych do tego celu edytorów (m oduły takie m ożna znaleźć np. w środowiskach e-learningo- wych LMS (np. Moodle) czy edytorach (np. Latex). Zaletą ich stosowania są dodatkowe informacje o form ularzu przydatne w procesie ich

przetwa-rzania i lokalizacji pól wyboru. Są to przede wszystkim dane dotyczące roz­ mieszczenia markerów oraz pól wyboru. M oduły te posiadają zwykle dużo bogatszą funkcjonalność, która dodatkowo pozwala m.in. na wygenerowa­ nie przez egzaminatora określonej liczby zestawów pytań wraz z kluczami odpowiedzi, im port danych do form atu XML, czy automatyczne tworzenie formularza elektronicznego. CHJC OOTTCZĄC* STU TD— c ,E! 1 fbrmHtnrc "1 M ueeUMiatl« □ ,— —„n |(tl » m jttt i totwt D , Z s * ' <vrw* U - 1

-^

L J a

Rys. 19. a) przykładowy formularz OMR; b) oznaczenie obszarów markerów i pól wyborów oraz przygotowanie formatki do korekty; c) „ręczne” przygotowanie for­ mularza.

Źródło: opracowanie własne.

Jeżeli dysponujemy już zdefiniowanym formularzem (w formie wydruku papierowego) niezbędne dane o lokalizacji markerów, pól wyboru czy ich rodzaju musimy wprowadzić sami. W zrealizowanym przez nas systemie służy do tego specjalny edytor graficzny (rys. 19 b). Wzorzec formularza jest skanowany, a następnie wprowadza się dane poprzez ich graficzne zazna­ czenie na obrazie przy pom ocy myszy lub rysika. Podejście to może okazać się czasochłonne w przypadku skomplikowanych dokumentów, jednak jest bardziej uniwersalne, gdyż formularz może być przygotowany przy pom ocy dowolnego edytora tekstowego.

Kolejnym, autorskim rozwiązaniem jeśli chodzi o przygotowanie for­ mularzy w ram ach zaimplementowanego systemu jest możliwość „ręczne­ go” ich stworzenia bez użycia (lub częściowo tylko) edytorów tekstowych i graficznych (rys. 19 c). Jest to możliwe dzięki zastosowaniu odpowiednich

Tomasz Gąciarz, Joanna Płażek, System automatycznego przetw arzania form ularzy OM R

m odułów przetwarzania wstępnego i rozpoznawania obrazów. W podej­ ściu tym rysujemy na kartce papieru m arkery oraz pola wyboru mając na uwadze odpowiednie odległości między nimi. Istnieje również możliwość wprowadzenia dodatkowych informacji (które nie będą widoczne na form u­ larzu) dotyczących np. rodzaju pól wyboru, akceptowanego obszaru wyboru poprzez zastosowanie odpowiednich kolorów. Taki wzorzec jest następnie skanowany przy użyciu dowolnego czytnika optycznego. Inteligentne opro­ gramowanie analizuje wprowadzony obraz i umożliwia w ydruk formularza bez informacji dodatkowych oraz generuje plik sterujący dla silnika OMR rozpoznającego wypełnione formularze. Podejście to okazuje się praktyczne w przypadku, gdy w ciągu kilku m inut chcemy przygotować formularze i np. przeprowadzić krótką ankietę lub test nie posiadając przy sobie komputera!

Binaryzacja

W przypadku wielu praktycznych zastosowań jednym z pierwszych eta­ pów przetwarzania obrazu jest jego binaryzacja. Ma ona zwykle na celu przekształcenie obrazu zapisanego w skali szarości na obraz binarny utoż­ samiany często z „czarno-białym”. Z sytuacją taką mamy np. do czynienia w przypadku przetwarzania obrazów dokumentów. Większość silników za­ projektowanych jest do pracy z obrazem binarnym. W trakcie binaryzacji dokonuje się zwykle oddzielenie tła od ważnych informacji z pierwszego planu. Należy pamiętać, że na tym etapie przetwarzania obrazu następuje redukcja informacji, która z jednej strony pozwala nam na zastosowanie pewnych m etod (w szczególności segmentacji) z drugiej jednak pozbawić nas może często cennych informacji związanych np. z poziom ami jasności. W arto więc tak projektować system, aby w razie potrzeby móc dysponować wszelkimi dostępnymi danymi.

Generalnie w procesie binaryzacji dążymy do otrzym ania obrazu o (x ,y )

przyjmującego dwie wartości:

gdzie 0 zwykle reprezentuje kolor czarny a 255 biały. Jeśli obraz wynikowy jest binarny i jeden piksel opisywany jest jednym bitem, często 0 związane

jest z tłem czyli kolorem białym a 1 z kolorem czarnym. t(x ,y ) jest tzw. pro­

giem binaryzacji. W tradycyjnym podejściu (tzw. globalnego tresh o ld m g u )

oO .y) = [

0, dla g ( x , y) < t ( x , y ) ;

próg ten wyznaczany jest jeden (tzw. próg globalny) dla wszystkich pikseli obrazu. Najbardziej znaną m etodą jego określania jest m etoda Otsu [1].

Przy obecnej mocy obliczeniowej procesorów oraz wymaganiach jakie stawiają przed nam i nowe urządzenia stosowane coraz częściej do akwizycji obrazów np. aparatów fotograficznych, czy kamer wideo wysokiej rozdziel­ czości coraz częściej używa się efektywnych m etodach binaryzacji adapta­ cyjnej. Dotyczy to w szczególności technologii OCR i OMR.

M etody globalne mają zastosowanie w przypadku np. dokum entów ska­ nowanych tradycyjnie gdzie poziom jasności, przy której wykonywany jest skan, raczej się nie zmienia. Obecnie obraz wykonany np. aparatem fotogra­ ficznym, którym dysponujemy w telefonie komórkowym jest pełen niedo­ skonałości i zniekształceń (perspektywicznych i soczewkowych) oraz różnic w oświetleniu m.in. z tego wynikających. Wyznaczenie globalnego progu bi­ naryzacji w większości tych przypadków nie przyniesie nam zadawalającego rezultatu. Próg ten należy bowiem dostosować lokalnie do danych fragm en­ tów obrazu. Będzie on inny w regionach słabo oświetlonych o małej w arian­ cji, a inny w miejscach o dużym kontraście.