• Nie Znaleziono Wyników

Metody analizy wybranych cech pisma ręcznego na potrzeby inteligentnego systemu obliczeniowego

N/A
N/A
Protected

Academic year: 2021

Share "Metody analizy wybranych cech pisma ręcznego na potrzeby inteligentnego systemu obliczeniowego"

Copied!
148
0
0

Pełen tekst

(1)

Na prawach rkopisu

Instytut Informatyki, Automatyki i Robotyki

Politechniki Wrocawskiej

Metody analizy wybranych cech pisma rcznego na

potrzeby inteligentnego systemu obliczeniowego

(rozprawa doktorska) Roman PTAK

Promotor: dr hab. in. Jan Magott, prof. PWr

Sowa kluczowe:  pismo rczne,

 automatyczna identyfikacja wykonawcy,  automatyczna weryfikacja wykonawcy,  rzutowanie obrazu,

 wspóczynniki ksztatu,  klasyfikacja.

(2)
(3)

Podzikowania

Skadam gorce podzikowania prof. Janowi Magottowi za pomoc w realizacji pracy, bez którego opieki i wsparcia powstanie tej dysertacji byoby niemoliwe.

Pragn take podzikowa prof. Mirosawowi Owocowi za cenne uwagi, które byy bardzo pomocne w przygotowaniu i redakcji pracy.

Dalsze podzikowania kieruj do pracowników Katedry Kryminalistyki Uniwersytetu Wrocawskiego

(4)

Spis treci

Wykaz waniejszych skrótów, symboli i oznacze………...6

1. Wprowadzenie ... 10

1.1. To pracy ... 11

1.2. Cel i teza pracy ... 14

1.3. Struktura pracy... 15

2. Przedmiot bada ... 17

2.1. Pismo ... 17

2.2. Analiza cech pisma rcznego w inteligentnym systemie obliczeniowym ... 19

2.3. Stosowane pojcia, wyjanienia terminologiczne ... 21

3. Cechy pisma rcznego ... 28

3.1. Zmienne ... 28

3.2. Zaleno zmiennych... 32

4. Stosowane rozwizania i oprogramowanie... 34

5. Materia badawczy ... 39

5.1. Zestaw 1... 39

5.2. Zestaw 2... 40

5.3. Zestaw 3... 41

6. Przetwarzanie obrazu pisma ... 42

6.1. Przetwarzanie wstpne i zwizane z nim bdy pomiarowe... 42

6.2. Segmentacja ... 43

7. Pomiar ... 45

7.1. Pomiar rczny ... 45

7.2. Pomiar automatyczny ... 47

8. Wielko pisma... 48

8.1. Metoda pomiaru automatycznego... 49

8.2. Analiza porównawcza wyników pomiaru, bd pomiarowy ... 56

8.3. Adaptacja innych metod do pomiaru wysokoci pisma... 58

8.3.1. Metoda Vinciarelli i Luettin ... 58

8.3.2. Metoda Marti i Bunke... 59

8.4. Podsumowanie ... 61

9. Pole pisma... 63

(5)

9.2. Wspóczynniki ksztatu... 66

9.3. Powoka wypuka i wspóczynnik wypukoci ... 70

9.3.1. Przeksztacenia morfologiczne ... 72

9.3.2. Algorytm wyznaczania powoki wypukej ... 77

9.3.3. Pomiar wspóczynnika wypukoci ... 78

9.4. Podsumowanie ... 86

10. Parametry zwizane z liniatur ... 87

10.1. Wyznaczanie obszarów w rzucie ... 88

10.2. Proponowane parametry ... 89

10.3. Podsumowanie ... 91

11. Inne cechy ... 92

11.1. Szeroko linii pisma ... 92

11.2. Wspóczynnik integracji ... 95

11.3. Entropia... 105

11.4. Podsumowanie ... 106

12. Proces identyfikacji pismoznawczej ... 107

12.1. Klasyfikacja ... 108

12.2. Metoda k-NN ... 110

12.3. Selekcja cech... 111

12.4. Wyniki klasyfikacji... 113

12.5. Wykorzystanie sztucznych sieci neuronowych ... 115

12.6. Inne rozwizania ... 118

12.7. Porównanie algorytmów rozpoznawania... 119

13. Podsumowanie i wnioski ... 121 Bibliografia ... 125 Skorowidz ... 131 Spis ilustracji... 133 Spis tabel... 135 Dodatki... 136

Katalog graficznych cech pisma rcznego IES... 137

(6)

Wykaz waniejszych skrótów, symboli i oznacze

ae — o wielka elipsy

m i i

a 1 — cig skoczony (ang. finite ordered set of elements) b — dugo boku w wielokcie

be — o maa elipsy B — obraz pisma

B(x, y) — punkt obrazu o wspórzdnych dyskretnych x, y c — cecha pisma

ConvD — niedobór wypukoci

d — liczba rozpatrywanych cech w procesie klasyfikacji D — liczba wszystkich cech, którymi opisujemy obiekt DP, DL — wspóczynniki kolistoci

DL — dugo linii pisma ei — i-ta etykieta obrazu

E — entropia

E — zbiór etykiet elementów obrazu B f1 — odlego OCOG od liniatury f2 — szeroko pasma ródlinijnego f3 — „masa” na szerokoci n-pikseli

Fmax — maksymalna rednica Fereta

Fmin — minimalna rednica Fereta

Fx — pionowa rednica Fereta

Fy — pozioma rednica Fereta hG i — wielko i-tej grammy

r ˆ

h — rednia wielko pisma mierzona rcznie

h'r — rednia wielko pisma mierzona automatycznie N

i,

ˆ

W

h — wielko i-tego wyrazu klasy w próbce zmierzonego metod rczn W i, — wielko i-tego wyrazu klasy w próbce zmierzonego metod

automatyczn

hW i(m) — wielko i-tego wyrazu mierzonego metod Marti i Bunke H — powoka wypuka

(7)

IM — impuls pisma

k — liczba rozpatrywanych ssiadów w metodzie k-najbliszych ssiadów

K — miara Komogorowa

lki — i-ta liczba ksztatu

lx,i — dugo i-tego cigu 0-1 w x kolumnie obrazu ly,i — dugo i-tego cigu 0-1 w y wierszu obrazu

L, L(B) — obwód obiektu B

LOS — liczba obszarów spójnych m — numer klasy obiektu max — warto maksymalna max(p) — warto maksymalna w rzucie min — warto minimalna M — liczba klas obiektów MD — rednica Martina

MLP — Perceptron wielowarstwowy (ang. Multi Layer Perceptron) Mx — moment bezwadnoci obiektu wzgldem osi Ox

Mxy — centralny moment bezwadnoci

My — moment bezwadnoci obiektu wzgldem osi Oy nwG — liczba gramm niewizanych

np — liczba pocze

N — zbiór liczb naturalnych NG — liczba mierzonych gramm

Nkol — liczba kolorów (odcieni szaroci) w obrazie

NW — liczba mierzonych wyrazów klasy w danej próbce OCOG — rodek cikoci

OCR — optyczne rozpoznawanie znaków (ang. Optical Character Recognition) p(x) — rzut pionowy obrazu

p(y) — rzut poziomy obrazu P, P(B) — pole powierzchni obiektu

P(X) — prawdopodobiestwo zdarzenia X

P(X = x) — prawdopodobiestwo zdarzenia, e zmienna losowa X przyjmie warto x P(X|Y) — prawdopodobiestwo warunkowe zajcia zdarzenia X skoro zaszo

(8)

P(c|xi) — prawdopodobiestwo warunkowe przynalenoci danego obiektu

opisanego wektorem cech c do poszczególnych klas xi

P(xi) — prawdopodobiestwo wystpienia danego poziomu intensywnoci xi

Pod(gi, g´i) — funkcja podobiestwa obserwacji gi i g´i rconv — wspóczynnik wypukoci

re — wspóczynnik eliptyczny rhw — wspóczynnik proporcji rr — wspóczynnik promieni rB — wspóczynnik Blaira-Blissa rD — wspóczynnik Danielsona

rDB — wspóczynnik kolistoci Drainge-Basin rF — wspóczynnik Fereta

rH — wspóczynnik Haralicka

rHc — wspóczynnik zwartoci Hortona rM — wspóczynnik Malinowskiej

rR — wspóczynnik odlegoci COG od obrzea figury rS — wspóczynnik ksztatu

rW — wspóczynnik Wadella

RCOG(D) — odlego OCOG obiektu B do jej brzegu w kierunku D.

RCOG max — maksymalna odlego OCOG obiektu B od obrzea konturu

RCOG min — minimalna odlego OCOG obiektu B od obrzea konturu

Rin(B) — promie najwikszego okrgu wewntrz obiektu B

Rout(B) — promie najmniejszego okrgu zawierajcego w sobie obiekt B

s — odchylenie standardowe

s2 — wariancja

S — element strukturalny w algorytmach morfologicznych SE — system ekspertowy

SL — szeroko linii pisma

t — czas

u — liczba neuronów w warstwie wejciowej MLP v — liczba neuronów w warstwie ukrytej MLP v(i)j — j-ty neuron w i-tej warstwie MLP

w — liczba neuronów w warstwie wyjciowej MLP wG — liczba gramm wizanych

(9)

WI — wspóczynnik integracji pisma x — wspórzdna x punktu obrazu,

¬ ¼

x — zaokrglanie w dó (ang. floor function)

ª º

x — zaokrglanie w gór (ang. ceiling function) xCOG — rodek cikoci wzgldem osi Ox

xi — poziom intensywnoci danego t-tego odcienia koloru y — wspórzdna y punktu obrazu

ybl — dolne ograniczenie pasma ródlinijnego (w metodzie Marti i Bunke) ybu — górne ograniczenie pasma ródlinijnego (w metodzie Marti i Bunke) yCOG — rodek cikoci wzgldem osi Oy

yl — dolne ograniczenie pasma podlinijnego yu — górne ograniczenie pasma nadlinijnego Z — zbiór liczb cakowitych

D

— warto progowa w rzucie  — kty wewntrzne wieloboku

 — warto progowa w algorytmie obliczajcym LOS

G

ij — odlego obserwacji i-tej i j-tej

H

c — bd klasyfikacji

H

k — bd kwantyzacji

H

p — bd próbkowania

H

r — redni bd pomiaru wielkoci pisma dla caej próbki

H

r — redni bd pomiaru wielkoci pisma wyrazów klasy — kt najmniejszego momentu bezwadnoci

— numer klasy wyrazów — wspóczynnik zmiennoci 'Nkol — przedzia kwantyzacji

G, G(B) — zbiór gramm (ang. stroke set) w obrazie pisma B L — zbiór liter (ang. letter set)

R — zbiór wierszy (ang. line of text set)

U — zbiór ustpów, wersetów (ang. paragraph set) W — zbiór wyrazów (ang. word set)

(10)

1. Wprowadzenie

Od momentu wynalezienia pisma zaistniaa moliwo komunikacji pomidzy ludmi na odlego i w czasie oraz zapamitywania informacji. Pismo rczne (ang. handwriting) pozwala ponadto na identyfikacj wykonawcy pisma, czyli wskazanie, kto wykona dany rkopis. Take i obecnie pismo rczne, czciowo zastpione przez pismo maszynowe, stanowi wany przedmiot przy badaniu dokumentów (ang. document examination).

Jedn z waniejszych dyscyplin badajcych pismo jest ekspertyza kryminalistyczna (ang. forensic handwriting examination). Ma ona swój pocztek w historyczny sposób ujmowanej grafologii. Badaniami pisma, czy te ogólnie badaniami autentycznoci dokumentów zajmuj si eksperci pisma zwani biegymi.

Badaniami pismoznawczymi poza kryminalistyk zajmuj si: grafologia (ang. graphology), psychologia (ang. psychology), psychiatria (ang. psychiatry), pedagogika (ang. pedagogics) [58], neurobiologia (ang. neuroscience), kinezjologia (ang. kinesiology), paleografia (ang. paleography) [96] itd. Zainteresowanie naukowców pismem rcznym i dorobek tych nauk podstawowych przyczyni si do wyonienia nowych poddyscyplin takich jak: historia pisma, technika pisma, fizjologia pisma, psychologia pisma, patologia pisma itp. Powsta nawet angielski termin: graphonomisc [35] oznaczajcy interdyscyplinarne badania nad wszystkimi aspektami zwizanymi z pismem rcznym.

Powstanie systemów komputerowych umoliwio wykonywanie pewnych zada zarezerwowanych do tej pory dla czowieka przez maszyny obliczeniowe. Pojawia si moliwo, aby informatyka (ang. computer science) i sztuczna inteligencja (ang. artificial intelligence) za przedmiot swych bada bray pismo rczne. Poczenie dorobku technologii informacyjnych i wiedzy ekspertów pozwoli zbudowa systemy ekspertowe do badania pisma. Technologie informacyjne zajmuj si najczciej badaniem pisma rcznego na potrzeby tzw. optycznego rozpoznawania znaków 1: OCR (ang. Optical Character Recognition), czy te ICR (ang. Intelligent Character Recognition). W polu zainteresowa tych nauk znalazy si take zagadnienia identyfikacji i weryfikacji wykonawcy pisma rcznego.

1

Termin znaki graficzne (pisarskie) rozumiemy jako pojcie ogólne obejmujce: litery, cyfry, grammy, znaki interpunkcyjne [107].

(11)

1.1. To pracy

Pismo rczne stanowice przedmiot zainteresowa wielu dyscyplin niesie w sobie bardzo duo informacji, take informacji poza treci zapiski. Badaniem pisma rcznego zajmuje si analiza pismoznawcza. Ma ona na celu dokonanie rozpoznania wykonawcy pisma — w terminologii pismoznawczej: identyfikacji czy te weryfikacji wykonawcy pisma. Celem pracy nie byo zbudowanie caociowego systemu informatycznego do realizacji powyszych zada (co przekracza zakres pracy), lecz opracowanie metod pomiaru wybranych cech pisma rcznego.

U podstaw przeprowadzonych bada ley stwierdzenie, e istniej formalizmy, które pozwalaj opisa cechy pisma rcznego. Systemy identyfikacji pisma rcznego wymagaj rzetelnego opracowania pomiaru cech identyfikujcych. Kwesti do rozstrzygnicia jest dobór tych cech, moliwo ich pomiaru oraz okrelenie rzetelnoci pomiaru. Okrela si przy tym bdy pomiarowe. Weryfikacja wyników procesu pomiaru automatycznego, który naley do procesu wnioskowania, wymaga aby wyniki uzyskane automatycznie mona byo odnie do pomiaru dokonywanego przez czowieka, tak zwanego rcznego. Interesujcym zagadnieniem jest take badanie waciwoci cech pisma rcznego m. in. zaleno badanych cech. Mona wysun hipotez, e dobór cech oraz stopie ich wzajemnej zalenoci maj wpyw na wynik rozpoznawania.

Pomiar automatyczny daje nam dodatkowe moliwoci pomiaru cech, które s poza moliwociami tradycyjnego pomiaru przeprowadzanego przez czowieka. Z tych cech warto wskaza te, które maj znaczenie identyfikujce. Automatyzacja pomiaru pozwoli na dokonanie znacznie wikszej liczby pomiarów w krótszym czasie ni gdyby dokonywa go czowiek. Pozwoli to na przebadanie znacznie szerszej populacji wykonawców pisma. Bdziemy mieli znacznie szerszy materia porównawczy, co pozwala wnioskowa na temat rozkadów statystycznych cech pisma rcznego.

Wielce istotne jest zastosowanie wieloletniego dorobku pismoznawców w zakresie: uporzdkowania poj pismoznawczych, formalizacji terminologii, rozwoju metod pomiarowych i przeprowadzania ekspertyzy pismoznawczej. Odnonie polskiego wkadu do rozwoju pismoznawstwa warto wymieni tu dorobek dwunastu 2 Wrocawskich Sympozjów Bada Pisma [42][43][40][41].

2

Dwunaste sympozjum obyo si w dniach 7–9 czerwca 2006 we Wrocawiu. Nie doczekao si jednak jeszcze publikacji materiaów konferencyjnych.

(12)

W technologiach informacyjnych w zakresie rozpoznawania istotnym jest take rozpoznawanie obrazu pisma. Rozwizanie problemów pomiaru cech pisma rcznego moe by te zastosowane na rzecz rozpoznania treci zapiski.

Istnieje bliski zwizek pomidzy zadaniem identyfikacji wykonawcy pisma a zadaniem rozpoznawania pisma. W dziedzinie rozpoznawania pisma mamy do chwili obecnej duy postp. Zagadnienie rozpoznawania pism maszynowych zostao ju w duej mierze rozwizane. Trwaj obecnie prace nad rozpoznawaniem pism rcznych. W rozwizaniu tego zagadnienia dominuje zastosowanie Ukrytych (Niejawnych) Modeli Markowa (ang. Hidden Markov Model) [101]. Model matematyczny tej techniki mona okreli jako parametryczn statystyczn metod klasyfikacji sekwencji zdarze. Szukany jest najbardziej prawdopodobnie pasujcy acuch zdarze wzorcowych do cigu testowego. Dlatego czasem mówimy take o tej metodzie, jako o ukrytych (niejawnych) acuchach Markowa. Modele te s równie stosowane w celu identyfikacji wykonawcy pisma [101].

Mona stosowa take prostsze klasyfikatory, które dziaaj szybciej co moe mie znaczenie dla szybkoci dziaania systemu komputerowego. Przykadem moe by np. metoda k-NN (ang. k-Nearest Neighbours), która zostaa zastosowana w tej pracy.

Zagadnienia rozpoznawania pisma [89] oraz identyfikacji i weryfikacji wykonawcy [88] s badane od wielu lat. Wybrane prace traktujce o tych kwestiach [5][8][101][102][104][119] osigaj cakiem obiecujce wyniki sigajce wartociami wspóczynników poprawienie zaklasyfikowanych wykonawców pisma powyej 90%. Spotykane w literaturze przedmiotu metody bazuj na pewnych grupach cech, nazywanych w rónoraki sposób przez autorów.

W pracy [8] oparto si na rozkadach prawdopodobiestwa kierunków (krawdzi) linii pisma (ang. edge-based directional features) jako wielkociach charakteryzujcych pismo rczne. Uwzgldniono zarówno same kierunki linii pisma jak i kty utworzone przez lini pisma w punktach zmian jej kierunku.

Autorzy publikacji [103][104] proponuj zastosowanie konturów elementów spójnych, tak zwanych CO3s (COCOCOs, ang. connected-component contours) i analiz funkcji gstoci prawdopodobiestwa odpowiadajcym im zmiennym losowym.

Monografia [22] wyrónia ca gam interesujcych cech na rónych poziomach skadowych: dokumentu, akapitu, wyrazu i znaku. Dla przykadu na poziomie znaku wymienia si takie cechy jak: GSC (ang. Gradient, Structural and Concavity features),

(13)

geometryczne (ang. geometric). Na mniejszych poziomach subtelnoci wymieniane s cechy zwizane z jasnoci pikseli obrazu, konturami obiektów, proporcjami rónych wielkoci, wciciami akapitowymi itp.

Innym podejciem jest analiza elementów skadowych pisma rcznego nazywanych z ang. graphemes [4]. Pojcie to zostanie bliej wyjanione w dalszych czciach pracy.

Jednake rozwizania spotykane w literaturze nie maj czsto na celu opracowania kompletnego katalogu uwzgldnianych cech na potrzeby klasyfikacyjne. Poza tym czsto badania byy wykonywane na rónych zestawach próbek pisma, nie zawsze reprezentujce stosowany w praktyce rkopimienny materia badawczy. Rónorodno badanego materiau nie zawsze pozwala na bezporednie porównywanie proponowanych w literaturze metod.

Do analizy uwzgldnianych cech pisma rcznego proponuje si w bogatej literaturze rónorakie techniki, np.: analiz gównych skadowych (ang. Principal Component Analysis, PCA) [119] lub mapy samoorganizujce si Kohonena (ang. Kohonen self organizing map, Kohonen SOM) [103][104]. Metody selekcji informacji bazujce „na podstawie teorii decyzji statystycznych, teorii informacji, porównywanie rozkadów prawdopodobiestwa oraz metod programowania matematycznego” omówiono w monografii [108].

Istnieje pena zaleno pomidzy rozpoznawaniem pisma a badaniami identyfikacyjnymi i weryfikacyjnymi wykonawcy pisma. Nie mona bowiem przeprowadzi w peni rzetelnej, przez co wiarygodnej, weryfikacji bez umiejtnoci odczytania zapisanej informacji. Dotyczy to zarówno ekspertów jak i systemów komputerowych. Mona postawi take tez, e nie mona rozpozna mao czytelnego pisma rcznego bez poznania zespou cech indywidualnych w takim pimie.

Badania poczynione na rzecz tej pracy s aktualne zarówno na potrzeby identyfikacji jak i wykonawcy pisma. Kluczowym jest dopiero sposób zastosowania opracowywanych metod pomiarowych w konkretnych rozwizaniach systemów do identyfikacji i weryfikacji.

Architektura typowego systemu komputerowego do rozpoznawania skada si z nastpujcych moduów: 1) przetwarzania wstpnego (ang. preprocessing), 2) wydzielania cech (ang. feature extraction) i 3) klasyfikacji (ang. classification) czyli waciwego moduu wnioskujcego, rozpoznajcego (ang. recognizer) [63]. W pracy opracowano wszystkie te moduy. Skupiono si jednak na etapie drugim, gdzie pomiar

(14)

cech stanowi jeden z waniejszych czci moduu wydzielania cech. W zakres pracy wchodzi okrelenie trafnoci i rzetelnoci pomiaru wybranych cech pisma rcznego na potrzeby klasyfikacji w systemie obliczeniowym. Dotyczy to midzy innymi sprawdzenia czy dana metoda obliczeniowa mierzy to, co jest mierzone przez ekspertów pisma.

Nie wyklucza to moliwoci pomiaru i zastosowania cech nie mierzonych przez ludzi do celów klasyfikacyjnych. Cechy mierzone automatycznie, a nie mierzone przez ekspertów mog nawet dawa lepsze wyniki klasyfikacji.

Analiza metod klasyfikacji na potrzeby identyfikacji jest szerokim zagadnieniem. Rozwaa zamieszczonych w tej pracy nie naley traktowa jako peny przegld metod klasyfikacji.

1.2. Cel i teza pracy

Celem pracy jest wykonanie przyczynku ku opracowaniu systemu obliczeniowego do pomiaru cech pisma rcznego na potrzeby identyfikacyjne w rozumieniu rozpoznawania. Ma to nastpi poprzez opracowanie metod pomiaru cech pisma rcznego. Rozwizanie powyszych zada stanowi pierwszy etap w rozwizaniu zagadnie identyfikacji pismoznawczej i rozpoznawania pisma rcznego.

Tez pracy sformuowano w nastpujcy sposób:

1. Mona stworzy katalog cech pisma rcznego mierzonych komputerowo odnoszcy si do dorobku nauk pismoznawczych.

2. Istniej nowe obliczeniowe metody pomiaru cech pisma rcznego.

3. Wartoci cech uzyskane dziki owym metodom rónicuj wykonawców, wic poprzez ich dobór i na ich podstawie mona dokona klasyfikacji wykonawcy.

Uzupenieniem powyszej tezy jest stwierdzenie, e istniej ju pewne algorytmy do pomiaru rónych cech pisma rcznego. Mona jednak postawi hipotez, e istniej nowe obliczeniowe metody pomiaru cech pisma. W zakres tej pracy wchodzi wic opracowanie algorytmów pomiaru cech pisma rcznego, które do tej pory nie doczekay si publikacji oraz opracowanie nowych algorytmów rozwizujcych dane zadanie w lepszy sposób od istniejcych.

W celu wykonania postawionego zadania opracowano szereg algorytmów (patrz strony: 53, 77, 101,110) pomiaru cech, które proponuje si doda do tworzonego katalogu.

(15)

1.3. Struktura pracy

Opracowanie skada si z trzynastu rozdziaów. Dwa kolejne rozdziay po wstpie wprowadzaj w tematyk pracy przybliajc przedmiot bada i podstawow terminologi. Ze wzgldu na to, e terminologia pismoznawcza jest bardzo bogata, zdefiniowane zastay waniejsze i stosowane terminy. Zaczony do pracy wykaz literatury pozwala odszuka w miar potrzeb dalsz terminologi. Rozdzia 3. omawia waciwoci charakterystyczne opisujce badane obiekty, czyli cechy pisma rcznego.

Kolejny, 4. rozdzia przyblia jakie oprogramowanie jest obecnie spotykane i które moe by zastosowane w praktyce pismoznawczej. Wymieniane jest zarówno powszechnie dostpne oprogramowanie jak i specjalistyczne oprogramowanie wspierajce prac ekspertów. Wskazuje si na te cechy systemów informatycznych, które s istotne z punktu widzenia bada pismoznawczych. Rozdzia 5. omawia sposób zebrania i przygotowania rkopimiennego materiau badawczego. W nastpnym rozdziale omawiane jest przetwarzanie wstpne obrazu wraz z informacj jakie bdy wnosi to przetwarzanie.

Rozdzia 7. stanowi wprowadzenie do zasadniczej czci pracy, w którym omawiane jest zagadnienie pomiaru w kontekcie bada pismoznawczych.

Nastpne cztery rozdziay omawiaj metody pomiaru cech pisma rcznego z kilku grup cech pisma rcznego. Rozdzia 8. dotyczy proponowanej metody pomiaru wielkoci pisma. Wyniki dziaania tej metody zostay odniesione do wyników uzyskiwanych metod pomiaru przez czowieka jak i do dwóch metod obliczeniowego okrelania cech stref pisma rcznego. W rozdziale 9. zaproponowano zastosowanie caego szeregu parametrów mogcych opisywa pole pisma. Szerzej omówiono pomiar i zastosowanie wspóczynnika wypukoci. Nastpny rozdzia 10. prezentuje moliwo okrelania pooenia pewnych elementów pisma w odniesieniu do liniatury. Rozdzia 11. traktuje o innych proponowanych cechach, które trudno pomieci w poprzednich trzech rozdziaach.

Rozdzia 12. omawia proces identyfikacji pismoznawczej w oparciu o okrelone cechy pisma rcznego. Zaproponowano zastosowanie dwóch metod klasyfikacji: metody najbliszego ssiada i zastosowanie sztucznych sieci neuronowych.

Podsumowanie opracowania oraz wnioski zamieszczono w rozdziale 13.

Do pracy zaczono take dodatki, które mog by pomocne w odbiorze prezentowanych treci. Jako pierwszy zacznik zdecydowano si na doczenie

(16)

publikowanego ju w kilku miejscach Katalogu graficznych cech pisma rcznego IES. Katalog ten stanowi wany element odnonikowy do treci prezentowanych w pracy. Ponadto cigle wymaganym jest aby by on propagowany wród pismoznawców wic prezentowany jest tu w caoci. Wybrane próbki rkopisów skadajce si na materia badawczy stanowi drugi zacznik.

(17)

2. Przedmiot bada

Przedmiotem przeprowadzonych bada jest pismo rczne. Twory graficzne zwizane z pismem rcznym oraz niesiona przez nie informacja podlega badaniom pismoznawczym. Istnieje wiele dyscyplin naukowych zajmujcych si t materi. W pracy zajto si pismem rcznym z punktu widzenia nauk informatycznych oraz kryminalistycznych. Badania dotycz zasadniczo pisma wspóczesnego. Pismo jest tu rozumiane w szerokim ujciu, czyli obejmujcym take podpisy.

2.1. Pismo

W badaniach pismoznawczych bierze si pod uwag cztery aspekty nazywane warstwami pisma:

x warstw graficzn, x warstw jzykow, x warstw treciow,

x warstw techniczn [51, s. 14].

W niniejszych badaniach zajto si warstw graficzn pisma, czyli grafizmem. Jest to jedyna warstwa pisma, która jest indywidualna. Historyczne ju pojcie „cecha indywidualna pisma” jest rozumiana jako „cecha indywidualna wykonawcy odwzorowana w pimie”. „Poniewa trwae indywidualne cechy wykonawcy (a tylko takie nas interesuj; mowa oczywicie o wzgldnej trwaoci) odwzorowuj si w wielu egzemplarzach podpisów [pisma], sensownie mona jedynie mówi o „grupowych cechach podpisów [pisma]” ” [77].

Grafizmowi, czyli obrazowi pisma mona przypisa pewne istotne mierzalne waciwoci, czyli takie, które mona obserwowa oraz mierzy. Waciwoci te najczciej nazywane s cechami (ang. features).

Take w pismoznawstwie podstawowym definiowanym terminem jest cecha pisma rcznego (ang. handwriting feature) rozumiana jako kada waciwo warstwy graficznej, jzykowej, treciowej lub technicznej pisma. Uporzdkowane wartoci cech tworz tak zwane wektory wartoci cech (lub skrótowo: wektory cech). Majc do dyspozycji wiksz liczb rozpatrywanych cech mamy wiksze szanse prawidowej ekspertyzy. W badaniach identyfikacyjnych istotniejsze s zespoy cech pisma ni poszczególne cechy. Znaczenie rónych informacji o obiekcie bada moe by róne i zaley w znacznej mierze od celu, jakiemu suy klasyfikacja [108]. Innym celem jest

(18)

klasyfikacja wykonawcy pisma rcznego a innym waciwa klasyfikacja zapisanej informacji, czyli innymi sowy rozpoznawanie pisma.

T. Wida w swojej pracy przybliy wybrane systemy podziau cech pisma rcznego. Najpopularniejsz klasyfikacj podziau cech pisma rcznego by system opracowany przez J. Crépieux-Jamina. Jego nastpcy z tak zwanej szkoy grafologicznej 3 oraz inni pismoznawcy wzorowali si na tej systematyce bd opracowali podobne [113, s. 22]. Wyczerpujce zestawienia katalogowe: cech pisma oraz metod bada pismoznawczych na potrzeby bada identyfikacyjnych jak i porównawczych (weryfikacyjnych) znajdziemy w pracy [51].

Analiza rozwoju opracowywanych katalogów uwzgldnianych cech pisma ukazuje wyran tendencj do zwikszania szczegóowoci ujmowania cech pisma. Pokazuje ponadto ich poszerzenie o cechy pozagraficzne: cechy nalece do warstwy jzykowej, treciowej oraz warstwy technicznej. „Tendencja ta jest niewtpliwie korzystna dla praktyki opiniowania; szczegóowa klasyfikacja [w rozumieniu taksonomicznym 4] cech pisma moe bowiem suy do budowy algorytmu badania pisma [51, s. 37]”. Stworzenie takiego algorytmu czy te algorytmów przyblia nas z kolei ku opracowaniu szeregu algorytmów komputerowych sucych temu samemu celowi.

Jedn z najnowszych klasyfikacji cech pisma rcznego jest Katalog Graficznych Cech Pisma Rcznego IES [51, s. 37–44][82][27, s. 789–971][38]. Odnonie warstwy jzykowej i warstwy treciowej wymieni tu naley Katalog Cech Jzykowo-Tre ciowych [38].

Bardzo ciekaw klasyfikacj cech pisma rcznego zaproponowa A. uszczuk wprowadzajc „klasyfikacyjn formu pisma rcznego” wzorowan na formule daktyloskopijnej [61].

Pobieranie próbek pisma moe si odbywa w tzw. trybie on-line lub off-line. Ze wzgldu na sposób wprowadzania danych do systemu informatycznego, systemy informatyczne mona podzieli na:

3

Grafologia rozumiana jest tutaj w ujciu historycznym, jako nauka która stoi u podstaw pismoznawstwa wspóczesnego. Jest to definicja ogólna bliska rozumieniu grafologii jako wszelkich bada pisma: porównawczych i identyfikacyjnych. Natomiast wedug definicji wskiej, grafologia rozumiana jest jako umiejtno okrelania charakteru czowieka; cech psychicznych, zdolnoci i upodoba czowieka na podstawie grafizmu 51, s. 63–64].

4

Dopisek autora. Naley tu odróni pojcie klasyfikacji rozumiane jako budow systematyki pisma czyli taksonomii od pojcia oznaczajcego jeden z etapów rozpoznawania.

(19)

x on-line — dane wprowadzane s w czasie rzeczywistym, dziki czemu system posiada informacje o trajektorii ruchu narzdzia pisarskiego w trakcie pisania. Najczciej s to funkcje okrelajce pozycje pióra w czasie (x(t), y(t)). Ponadto uzyskujemy informacje o naciskowoci,

x off-line — dane wejciowe zawieraj statyczne obrazy znaków w postaci macierzy punktów.

W niniejszych badaniach (podobnie jak w szerokiej praktyce pismoznawczej) próbki pisma nie byy pobierane w trakcie ich wytwarzania, dlatego mamy do czynienia z problemem off-line. Niemoliwym przez to byo uzyskanie takich cech pisma jak: szybko pisania i nacisk.

W tej pracy przedstawiono wyniki bada nad moliwoci okrelania wybranych cech pisma rcznego. Zbadano czy taki pomiar jest moliwy, jakimi metodami mona bada te cechy i sprawdzono skuteczno tych metod. Skoncentrowano si na pomiarze cech pisma rcznego zapisanego w jzyku polskim. Polski alfabet skada si w praktyce z nastpujcych 35 5 maych liter (minuskulnych): a, , b, c, , d, e, , f, g, h, i, j, k, l, , m, n, , o, ó, p, q, r, s, , t, u, v, w, x, y, z, , , oraz 35 duych liter (maiuskulnych): A, , B, C, , D, E, , F, G, H, I, J, K, L, , M, N, , O, Ó, P, Q, R, S, , T, U, V, W, X, Y, Z, , . Oparty on zosta na alfabecie aciskim z dodatkowymi dziewicioma literami ze znakami diakrytycznymi [62, s. 14].

2.2. Analiza cech pisma rcznego w inteligentnym systemie obliczeniowym

Istnieje potrzeba obiektywizacji bada w odniesieniu do pismoznawstwa. Potrzeb tak dostrzega wielu pismoznawców [54]. Sformalizowanie opisu pisma pozwala poprawi efektywno ekspertyz pismoznawczych dziki temu, e wszyscy eksperci bd porozumiewa si t sam terminologi. W jego wyniku mona uwiarygodni tezy i sdy, które bd zrozumiae dla wszystkich ekspertów. Taki formalizm daje moliwo atwiejszej prezentacji wyników bada oraz wymian dowiadcze pomidzy naukowcami rónych dyscyplin.

Formalizacja jzyka pismoznawców oraz opis procesu ich postpowania daje moliwo zastosowania komputerów w badaniach pismoznawczych. Opis poj i przeledzenie procesu wnioskowania pozwala opisa sposób przeprowadzania ekspertyzy, sposób wnioskowania itp., co pomoe zbudowa system ekspertowy (SE)

5

(20)

wspomagajcy prac pismoznawców. Powstanie „Systemu Ekspertowego Pismoznawstwa” postulowane jest w pracy [81]. Zastosowanie dorobku sztucznej inteligencji daje moliwo zbudowania systemu ekspertowego. Pozwoli on przyspieszy prac eksperta pisma, wykonywa efektywniej kwerendy itp. Komputerowy system ekspertowy moe dokonywa pomiaru cech pisma rcznego a nastpnie procesu wnioskowania w maszynie wnioskujcej (ang. inference engine) w oparciu o wiedz zgromadzon w bazie wiedzy (ang. knowledge base) [71].

Taki system moe wzorowa si w swoim dziaaniu na pracy ekspertów pisma. Posiadaby on wszystkie cechy SE, np. moliwo przeledzenia procesu wnioskowania. Wtedy w kadej chwili mona przygldn si wynikom etapów porednich wnioskowania.

Aby zadania stawiane przed pismoznawcami mogy by realizowane przez system informatyczny naley opracowa modele matematyczne wszystkich badanych obiektów [84]. Wprowadzenie formalnego opisu cech obrazu pisma rcznego pozwala na zastosowanie obliczeniowych metod pomiarowych do okrelania tych cech. W konkretnym przypadku zastosowanie formalizmu zwizanego z Katalogiem Graficznych Cech Pisma Rcznego IES uatwia zbudowanie systemu komputerowego do rozwizywania zadania pomiaru cech pisma rcznego i dalej identyfikacji.

Wród rónych systemów automatycznej analizy pisma mona wprowadzi podzia ze wzgldu na to, czy naladowana jest praca ekspertów pismoznawców, czy te stosuje si inne techniki, waciwe rozpoznawaniu obrazów. Technik bazujc na metodach analizy obrazu jest np. traktowanie obrazu tekstu jako tekstury [99]. Innym podejciem jest zastosowanie pomiaru cech uzyskiwanych dziki teorii fraktali [9][10]. W procesie identyfikacji mona take wzorowa si na pracy czowieka w pewnych etapach jego pracy. W takich systemach automatyzowany jest pomiar cech pisma, które s brane pod uwag przez ekspertów, pismoznawców. Zmierzone cechy stanowi dane wejciowe do systemu ekspertowego.

Moliwo automatycznego pomiaru cech pisma rcznego jest wymogiem dla zbudowania w peni automatycznego systemu ekspertowego, który bdzie wspiera prac eksperta pisma. Pierwszym etapem jest wic opracowanie penej metodologii automatycznego pomiaru cech pisma. Szczególnie wane jest czy istnieje oraz jaka jest zaleno pomidzy cechami pisma z rónych grup cech np. pomidzy cechami mierzalnymi a syntetycznymi. Mona by wtedy okrela stopie zalenoci pomidzy nimi.

(21)

Zadanie wspomagania pracy pismoznawcy bdzie móg wykona system obliczeniowy jednak dopiero wtedy, gdy materia badawczy bdzie dostpny w postaci elektronicznej w postaci zeskanowanych rkopisów.

Istnieje moliwo wspierania bada pismoznawców na rónych etapach ich pracy: gromadzenia, przechowywania danych oraz pomiaru cech próbek pisma. System komputerowy, wspierajcy prac eksperta, nadaje si doskonale do wykonywania kwerend oraz przetwarzania wstpnego. Ponadto zastosowanie komputerów w procesie oblicze statystycznych oraz wnioskowania moe przynie przyspieszenie bada.

Baza wiedzy w systemie ekspertowym winna by stosowna do stawianego problemu przez jedn z nauk zajmujcych si badaniem pisma. Trzeba uwzgldni rónice w pracy np. kryminalistyka pismoznawcy, a historyka zajmujcego si paleografi. W pracy [106] zwrócono uwag, e „stopie indywidualnoci pisma rcznego” w rónych okresach historycznych by róny. Szczególnie newralgiczne s na przykad okresy przechodzenia ze stylu pisma romaskiego na pismo gotyckie lub z pisma gotyckiego do humanistycznego. Naley mie wic do dyspozycji informacje na temat zmian cech pisma w przecigu caych okresów historycznych.

W zalenoci od zastosowania bdziemy wykorzystywa baz wiedzy zawierajc wiedz eksperta z dziedziny ekspertyzy kryminalistycznej, paleografii, czy te innej nauki.

2.3. Stosowane pojcia, wyjanienia terminologiczne

W opisie cech graficznych pisma rcznego stosowanych jest wiele poj. W tym rozdziale zostay przedstawione podstawowe pojcia i definicje wykorzystywane w niniejszych badaniach.

Obraz pisma w trybie off-line jest zapisywany w postaci rastrowej, std do opisu obrazu mona uy macierzy. W reprezentacji obrazu uywa si ukadu wspórzdnych pikselowych. Jest to kartezjaski ukad wspórzdnych prostoktnych i z przyczyn technicznych najczciej stosowany w technice komputerowej do opisu grafiki rastrowej. Oczywicie nie musi to by jedynym [56, s. 11–12] i najlepszym rozwizaniem, poniewa w pracy [79] wskazano ukad wspórzdnych biegunowych jako bardziej dopasowany do waciwoci zmysu wzroku.

Zbiór punktów (pikseli) obrazu oznaczmy jako B, wtedy B(x, y) oznacza punkt obrazu o wspórzdnych dyskretnych x, y. B(x, y) {0, 1, …, Nkol-1}, gdzie: Nkol

(22)

gdzie: 0 oznacza kolor podoa pisarskiego (ta), 1 oznacza kolor narzdzia pisarskiego (oówka, pióra, dugopisu itp.). Reprezentacj graficzn obrazu w prawoskrtnym, kartezjaskim ukadzie wspórzdnych pokazano na Rys. 1.

Rys. 1. Ukad wspórzdnych stosowany do opisu obrazu

Do okrelenia wielkoci pisma i innych jego cech istotne jest pojcie grammy 6. Gramma (ang. stroke lub grapheme) jest elementem graficznym, skadowym litery bdcym pojedynczym ukiem lub odcinkiem. Sownik Terminów Pismoznawczych IES definiuje gramm jako: „konstrukcyjnie wyodrbniona cz znaku graficznego”. W innym miejscu znajdujemy definicj: „gramma to odrbnie krelona linia w budowie litery bd jakiej jej czci” [33, s. 409 7]. Definicja odwoujca si do ruchu pisarskiego a nie do ladu narzdzia pisarskiego jest nastpujca: „gramma to element graficzny odzwierciedlajcy trajektori pojedynczego ruchu pisarskiego” [67].

W krgu nauki anglosaskiej jest znane pojcie grapheme rozumiane jako najmniejsza moliwa do rozrónienia, niepodzielna cz pisma; abstrakcyjne pojcie odnoszce si do litery alfabetu (ang. „The smallest identifiable unit of writing; not divisible; the abstract concept of a letter of the alphabet” [11]). Definicja ta opiera si na

6

Etym. - gr. grámma „litera; pismo, napis; ksiga” od gráphein „skroba; rytowa; rysowa; pisa” [47]. 7

(23)

innym kryterium wydzielania tych elementów. Podstaw wydzielania jest tutaj wynik technicznego procesu segmentacji i grupowania 8.

Bardziej praktyczn definicj grammy znajdujemy przy opisie parafy znajdujcym si w [50]: „fragment linii pisma lecy midzy wyrónionymi punktami”. Do rozwizania pozostaje okrelenie tych punktów. Do tych wyrónionych punktów zalicza si tam: punkty inicjacji, konstrukcyjne punkty zatrzymania, punkty ekstremalne i punkty zakoczenia zakrelenia. Sposób wyznaczania pewnych typów tych punktów w oparciu o zastosowanie sztucznych sieci neuronowych z polami recepcyjnymi pokazano w pracy [20].

Liczb gramm w literze mona ustali dowolnie. Istotne jest jednak to, aby w obliczeniach zachowa te same kryteria dla caoci analizowanego materiau [16][50][67]. W niniejszych badaniach przyjto za Felusiem [16] nastpujcy podzia liter na grammy (Tabela 1). Podzia liter na grammy zaley od sposobu pisania liter.

Tabela 1. Przykadowy podzia liter ze wzgldu na liczb skadow gramm

Rodzaj liter Liczba gramm

Mae litery Due litery

Jednogrammowe c, e, l, o, r, s, v, z C, I, J, L, O, S, V, Z Dwugrammowe a, b, , d, , f, g, h, i, j, k, , n, ó, p, q, , t, u, w, x, y, ,  A, , D, G, K. , M, N, Ó, P, Q, , T, U, W, X, Y, ,  Trzygrammowe , m,  , B, F, H, , R Wicejgrammowe — E, ,

Grammy moemy rozumie jako skadowe konstrukcyjne liter. W konstrukcji liter pojawiaj si elementy, które s okrelane specyficznym jzykiem: trzon, korpus, owal, uk, znak diakrytyczny, cznik, drzewiec, nóka [107].

W opisie pisma rcznego mówimy take o grammach wstpnych i wybiegowych. S to dodatkowe czci liter, które czasami pojawiaj si na pocztku krelonego wyrazu i/lub na jego kocu. Wynikaj one z natury ruchu pisarskiego i nie nios zasadniczo informacji o ksztacie liter.

8

Mowa tu o algorytmach segmentacji: (ang.) connected component segmentation — segmentacja skadników spójnych (tumaczenie autora) i grupowania: (ang.) sequential clustering technique — technika grupowania sekwencyjnego (tumaczenie autora) [4].

(24)

Rys. 2. Przykad podziau liter na grammy

Praktyczny przykad podziau liter na grammy zosta zaprezentowany na Rys. 2. Litera „z” w pierwszym wyrazie skada si z jednej grammy: z1, natomiast litera „z”

w drugim wyrazie skada si z trzech gramm: z2a, z2b i z2c. Dua litera „L” w drugim

wyrazie posiada ptlic i skada si z dwóch gramm: L2a, L2b w porównaniu z liter „L”

z jedn gramm: L1 w pierwszym wyrazie.

Ogólnie mona powiedzie, e gramma jest krzyw lub zbiorem krzywych mogcych by opisywanymi krzywymi matematycznymi rónych stopni. Naley okreli: do jakiego typu krzywych dana krzywa (lub fragment krzywej) naley, rodzin krzywych oraz parametry równania krzywej [48].

Definicje dalszych uywanych poj zostay przedstawione poniej.

Linia (trajektoria) pisma (ang. trajectory, trace of writing line) — widoczna lub domniemana droga, jak przebyo narzdzie pisarskie kierowane ludzk rk. W aspekcie widocznej czci linii pisma mówimy o ladzie narzdzia pisarskiego jaki zosta na podou. W wyniku pokrycia podoa pisarskiego materiaem kryjcym (atramentem, tuszem, past dugopisow, grafitem, pastel, wglem drzewnym, kred itd.) powstaje graficzny obraz pisma.

Okrelamy dugo  linii pisma (DL) i szeroko  linii pisma (SL) nazywan czasem gruboci linii (ang. stroke width). Sposób okrelania tych wielkoci pokazano na Rys. 3. W praktyce pismoznawczej, w niektórych wypadkach okrela si jeszcze gboko  linii pisma (GL) jako element opisu struktury linii pisma nazywanej w Sowniku Terminów Pismoznawczych IES kresk [107].

W tym miejscu naley sprecyzowa jeszcze termin szeroko  pisma w celu uniknicia pomyki z szerokoci linii pisma. Szeroko pisma jest cech opisujc ogólny wygld pisma. Oceniamy j na podstawie szerokoci znaków. Mierzy si j na podstawie wymiarów poprzecznych liter ródlinijnych: „a”, „c”, „e”, „n”, „o”, „u” lub na podstawie odpowiednich wymiarów gramm ródlinijnych w literach dwustrefowych, np.: „d”, „g”, „h”, „p”. W praktyce wynik takiego pomiaru odnosi si do wysokoci danej grammy. Dokonujemy okrelenia przez obliczenie stosunku bezwzgldnej

(25)

szerokoci znaku w tej strefie do bezwzgldnej wysokoci znaku. Zalenie od wartoci tego stosunku wyrónia si znaki smuke, znaki proporcjonalne i znaki szerokie. Mówimy wtedy np. o pimie smukym, szerokim itp.

Wysoko  pisma jest rozumiana jako synonim wielkoci pisma. Definicja wielkoci pisma i sposób jej pomiaru zosta omówiony w rozdziale ósmym.

Rys. 3. Sposób okrelania dugoci i szerokoci linii pisma

Linia podstawowa pisma (ang. base line) — rozumiemy j tu jako pojcie ogólne obejmujce: lini podstawow wyrazu i lini podstawow wiersza. Linia podstawowa wyrazu to linia prosta czca najnisze punkty pierwszej oraz ostatniej grammy ródlinijnej w wyrazie. Jest to abstrakcyjna linia, na której opieraj si (teoretycznie) poszczególne litery w wyrazie. Analogicznie definiuje si lini podstawow caego wiersza tekstu.

rednia linia podstawowa pisma (ang. x-height guideline) — linia górnego ograniczenia obszaru rodkowego pisma (gramm ródlinijnych) pokrywajca si z górn krawdzi minusku (czyli maych liter), bez wydue górnych, np.: „a”, „c”, „e”. Nazwa angielskojzyczna pochodzi od wysokoci maej litery „x”.

Dolna linia ograniczajca pisma (ang. descender line) — linia pokrywajca si z doln krawdzi minusku z wydueniami dolnymi, np. „g”, „j”, „p”.

(26)

Górna linia ograniczajca pisma (ang. ascender line) — linia pokrywajca si z górnymi krawdziami minusku oraz minusku z wydueniami górnymi, np. „A”, „B”, „C”, „b”, „d”, „f”.

Powysze linie wydzielaj nastpujce obszary pisma: ródlinie (strefa rodkowa, ang. core zone) pomidzy lini podstawow a redni lini pisma, obszar nadlinijny (strefa górna, ang. ascender zone) ponad redni lini pisma, obszar podlinijny (strefa dolna, ang. descender zone) poniej linii podstawowej pisma (patrz Rys. 4).

Strefa (obszar) pisma — jedno z trzech wyrónianych poziomych pasm, czasem okrela si j te mianem wstgi (ang. band of writing). Jest to obszar ograniczony dwoma liniami prostymi lub amanymi, czy te ukami, w którym mieszcz si wszystkie grammy ródlinijne, podlinijne lub nadlinijne.

Rys. 4. Linie w pimie wyznaczajce obszary: ródlinijny, nadlinijny i podlinijny Jak ju wspomniano wyej, obszar pisma mona podzieli na obszar ródlinijny, nadlinijny i podlinijny. Cz liter posiada grammy, które przynale nie tylko do jednej strefy. Mamy do czynienia wtedy z grammami nadlinijno-ródlinijmymi i podlinijno-ródlinijnymi. W skrócie mówi si o grammach nadlinijnych i podlinijnych, co nie prowadzi zasadniczo do niejednoznacznoci. Litery nalece do strefy ródlinijno-nadlinijnego to: b, d, h, k, l, , t. Litery nalece do strefy ródlinijnego i podlinijnego to: j, p, q, y. Litera „f” naley do wszystkich trzech stref pisma. Pozostae litery nale do strefy ródlinijnej. Prawie poowa z nich posiada take grammy elementów diakrytycznych. Elementy diakrytyczne z reguy wykraczaj poza wspomniane obszary. Na przykad zasadnicza gramma litery „” jest ródlinijna. Element diakrytyczny, który wykracza poniej tego pasma nie zmienia klasyfikowania tej litery jako ródlinijna.

Grammy ródlinijne posiadaj nastpujce litery: a, , b, c, , d, e, , g, h, i, k, m, n, , o, ó, p, q, r, s, , u, v, w, x, y, z, , . Przez grammy ródlinijne rozumiemy tylko te

(27)

które nale do jednej strefy. Dlatego do liter tej grupy nie zaliczamy litery „f”, której zasadnicza gramma co prawda naley do pasma rodkowego ale rozciga si te na pozostae dwa obszary. Trzon litery „f” jest gramm nadlinijno-ródlinijno-podlinij.

Due litery przynale w zasadniczej czci do stref nadlinijnej i ródlinijnej. Pochylenie linii podstawowej pisma (ang. slope, skew) — kt, jaki jest zawarty pomidzy lini podstawow pisma a podstaw kartki.

Pochylenie pisma (ang. slant) — kt, jaki jest zawarty pomidzy lini podstawow pisma a elementami pionowymi w literach.

Podpis — nazwisko i imi napisane wasnorcznie stanowice potwierdzenie pisma, nadanie mu wanoci. Wyrónia si podpis penobrzmicy i skrócony.

Parafa — najbardziej zautomatyzowana i kracowo skrócona posta podpisu nieczytelnego, luno lub wcale nie nawizujca do literalnego brzmienia nazwiska lub imienia [51, s. 20][49].

Wanym przyczynkiem zmierzajcym do uporzdkowania terminologii w dziedzinie bada pisma rcznego jest opracowywanie Sownika Terminów Pismoznawczych przez Instytut Ekspertyz Sdowych (IES). Sownik ten zosta niedawno opublikowany w Internecie [107]. Jest on cigle w trakcie opracowywania.

(28)

3. Cechy pisma rcznego

Pismo rczne jako obiekt bada jest opisywane za pomoc interesujcych z danego badawczego punktu widzenia informacji, charakteryzujcych obiekt. Mona te powiedzie, e obiekt niesie pewne informacje charakteryzujce. Kad tak informacj charakteryzujc nazywamy cech. Synonimami cechy s pojcia: dana, wasno, waciwo.

Ponadto czsto pojawia si pojcie parametru 9, które naley rozumie jako synonim wartoci cechy. Jest to charakterystyczna wielko, czsto liczbowa odzwierciedlajca warto danej cechy.

3.1. Zmienne

Jeli o danej cesze moemy powiedzie, e przyjmuje co najmniej dwie róne wartoci, to jest to zmienna (ang. variable). Wyróniamy zmienne dwuwartociowe i wielowartociowe, cige i dyskretne.

Zmienna bdca przedmiotem danego badania, której zwizki z innymi zmiennymi chcemy okreli nosi nazw zmiennej zalenej (ang. dependent variable). Natomiast zmienne od których ona zaley, poniewa te zmienne na ni oddziaywaj, nosz nazw zmiennych niezalenych (ang. independent variable).

Liczba cech pisma rcznego jest dua (o czym wiadczy chociaby ich liczba w Katalogu Graficznych Cech Pisma Rcznego IES), wiksza od liczby cech pisma maszynowego. Liczb informacji identyfikujcych znajdujcych si w rkopisie jest cile zwizana z liczb cech pisma. Liczb t mona okrela zgodnie z teori informacji [80].

Cechy pisma rcznego mona wyrónia na rónych poziomach subtelnoci: makrostrukturalnym, podstawowym i mikrostrukturalnym. Na poziomie makrostrukturalnym cechy pisma dotycz dokumentu, wersetu oraz wyrazu. Na poziomie tym operujemy wielkociami powyej kilku milimetrów. Poziom podstawowy obejmuje litery i ich skadowe. W ramach tego poziomu operuje si wielkociami rzdu kilku milimetrów (zwykle 1,5–6 mm). Cechy na poziomie mikrostruktury dotycz linii pisma jako elementu struktury na poziomie podstawowym. Szeroko i gboko

9

Spotyka si take definicje, e parametr to zmienna, któr przyjmuje si za sta w danym zagadnieniu, sta dla danego zbioru obiektów.

(29)

(wysoko) linii pisma mona rozpatrywa w zakresie mikrostruktury. Zwykle szeroko linii pisma wynosi 0,2–0,5 mm a gboko rzdu uamków milimetra [52].

W miar gruntowna klasyfikacja cech graficznych zostaa ujta w Katalogu Graficznych Cech Pisma Rcznego IES, opracowanym w ramach Jesiennej Szkoy Empirycznych Bada Pisma Rcznego, dziaajcej przy krakowskim Instytucie Ekspertyz Sdowych [51][34]. Ciekawym uzupenieniem tego katalogu s propozycje zmian zaproponowane w pracy [51] i tame nowa propozycja Katalogu Graficznych Cech Paraf. Cechy pisma rcznego dzieli si na nastpujce grupy:

1. cechy syntetyczne, 2. cechy topograficzne, 3. cechy motoryczne, 4. cechy mierzalne, 5. cechy konstrukcyjne.

Jednake podgrupa „budowa znaków” z grupy „cech konstrukcyjnych” jest dopiero w trakcie opracowania. Przyczynkiem jest opracowanie „Szczegóowego katalogu graficznych cech majuskuy B” [82][76]. Poza cechami graficznymi w analizie pismoznawczej pod uwag bierze si te warstw jzykowo-treciow.

Opracowano zestawienie tabelaryczne cech pisma rcznego, które mona mierzy metodami komputerowymi. W tabeli poniej (Tabela 2) pokazano systematyk mierzonych cech z podaniem, na jakim poziomie subtelnoci dan cech mona mierzy. Numery cech odnosz si do numeracji stosowanej w Katalogu Graficznych Cech Pisma Rcznego IES aby uatwi orientacj. Grupa ostatnia oznaczona jako „Inne cechy” zawiera cechy z poza wspomnianego katalogu. Ponadto podano informacj (ostatnie dwie kolumny), czy dan cech mierzymy w systemach on-line czy off-line. Tabel t naley traktowa jako syntez prac autora oraz informacji zaczerpnitych z literatury. Niniejsza tabela stanowi pierwszy krok do opracowania penego Katalogu Cech Rozpoznawanych Komputerowo. Informacje w niej zawarte naley traktowa jako propozycj i naley j uzupenia wraz z opracowywaniem kolejnych cech mierzonych komputerowo. Stanowi wic ona raczej szkic penego Katalogu Cech Rozpoznawanych Komputerowo.

(30)

Tabela 2. Katalog cech pisma rcznego mierzonych komputerowo: systematyka cech

T — oznacza, e dan cech mona mierzy w danym ukadzie, N — oznacza, e cechy nie mona mierzy, – (kreska) — zjawisko nie wystpuje (nie dotyczy), ˜ (kropka) — brak informacji lub brak informacji wiarygodnych.

Nr Cecha

Doku

men

t

Werset Linia (wiersz

)

Wyraz Litera Gra

mma

On-line Off-line 1 Cechy syntetyczne

1.1 Typ pisma ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.2 Stopie naturalnoci ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.3 Etap rozwoju pisma ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.4 Klasa pisma ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.5 Ogólny obraz pisma ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.6 Stopie starannoci ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.7 Czytelno ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.8 Uzupenienia ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.9 Sposób wykonania ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

1.10 Inne cechy syntetyczne ˜ ˜ ˜ ˜ ˜ ˜ ˜ ˜

2 Cechy topograficzne

2.1 Margines lewy: Ksztat T T – – – – T T

--: Tendencja T T – – – – T T

--: Wielko T T – – – – T T

--: Proporcje T T – – – – T T

2.2 Margines prawy: jw. --

2.3 Margines górny: Ksztat T T – – – – T T

--: Tendencja T T – – – – T T

--: Wielko T T – – – – T T

--: Proporcje T T – – – – T T

2.4 Margines dolny: jw. --

2.5 Wcicia akapitowe: Gboko – T T – – – T T

--: Czsto T – – – – – T T

2.6 Ukad wierszy wzgldem siebie T T – – – T T T

2.7 Ukad znaków wzgldem siebie T T T T T T T T

2.8 Ukad znaków, wyrazów i wierszy wzgldem

liniatury – – T T T T T T

2.9 Linia wyrazów i wierszy: Ksztat – – T T – – T T

--: Kierunek (tendencja linii podstawowej) – – T T – – T T

2.10 Odstpy midzy wierszami T T – – – – T T

2.11 Odstpy midzy wyrazami T T T – – – T T

2.12 Odstpy midzy znakami – – T T – – T T

2.13 Rozmieszczenie adresów: Pionowe T T – – – – T T

--: Poziome T T – – – – T T

2.14 Rozmieszczenie dat: Pionowe T T – – – – T T

--: Poziome T T – – – – T T

2.15 Rozmieszczenie nagówków T T – – – – T T

2.16 Rozmieszczenie podpisów T – – – – – T T

3 Cechy motoryczne 3.1 Tempo pisania (szybko):

Tempo okrelane bezwzgldnie T T T T T T T N

Tempo okrelane w ramach próbki pisma T T T T T T T N Tempo okrelane wzgldem normy osobniczej T T T T T T T N

3.2 Impuls T T T T T – T T

– Wspóczynnik integracji pisma T T T T T – T T

(31)

Linia (wiersz ) Doku men t Gra mma Nr Cecha Off-line On-line

Werset Wyraz Litera w pojedynczych literach lub cyfrach

--: w zespoach graficznych T T T T – – T T

3.4 Nacisk: kierunek (zwrot) T T T T T T T N

--: sia nacisku T T T T T T T N

--: równomierno nacisku T T T T T T T N

--: miejsce wzmoenia nacisku T T T T T T T N

Cieniowanie: kierunek (zwrot) T T T T T T T T

--: natenie T T T T T T T T

--: równomierno cieniowania T T T T T T T T

--: miejsce wzmoenia cieniowania T T T T T T T T

4 Cechy mierzalne

4.1 Pole pisma T – T T T T T T

4.2 Wielko pisma T – T T T – T T

4.3 Szeroko znaków – – – – T – T T

4.4 Proporcje wysokoci elementów nadlinijnych

do wysokoci znaków ródlinijnych – – – T – – T T

4.5 Proporcje wysokoci elementów podlinijnych

do wysokoci znaków ródlinijnych – – – T – – T T

4.6 Nachylenie pisma – – – – T T T 5 Cechy konstrukcyjne 5.1 Budowa znaków – – – – T – T T 5.2 Odmiany znaków T – – – – – T T 5.3 Budowa wiza – – – T T – T T 5.4 Formy powtarzalne – – – T T – T T

Formy znaków interpunkcyjnych T – – – – – T T

6 Inne cechy

Entropia odcieni szaroci T – – – – – T T

Warto progowa binaryzacji T – – – – – T T

Liczba czarnych pikseli T T T T T T T T

Liczba wewntrznych i zewntrznych konturów T T T T T T T T Liczba pochylonych elementów kierunkowych

w 4 kierunkach T T T T – – T T

Wspóczynnik ksztatu (ang. aspect ratio) T T – T T – T T

Wspóczynnik pooenia rodka cikoci w pionie i poziomie (ang. centroid height and width ratio)

T T T T T T T T

Spatial features [22, s. 55–57] – – – – T – T T

GSC [22, s. 50–55] – – – – T – T T

Czci informacji w tabeli wymaga komentarza. Dla caoci cech syntetycznych moliwo pomiaru oznaczono ˜ (kropk), gdy pomiar cech syntetycznych polega w duej mierze na procesie interpretacji obrazu przez czowieka, co wymaga duego nakadu intelektualnego. Sdzi si, e mona opracowa algorytmy komputerowe, które bd mierzy pewne cechy syntetyczne, jednake co do trafnoci danego pomiaru trudno wycign jakie dokadniejsze wnioski.

(32)

3.2. Zaleno zmiennych

Jak ju wspomniano wyej oprócz okrelania cech istotnym jest take okrelanie zalenoci pomidzy cechami. Zaleno cech bdcymi zmiennymi mona opisywa aparatem matematycznym. Cechy pisma mona podzieli na podstawowe (elementarne) i kompleksowe.

Sownik Terminów Pismoznawczych IES definiuje cechy elementarne jako „cechy, których nie mona rozoy na cechy prostsze” [107]. W praktycznych przypadkach takie okrelenie nie jest jednoznaczne, poniewa nie zawsze mona stwierdzi osignicia granicy rozkadu. Proponuje si rozumienie troch szersze tego pojcia. Cechy podstawowe (np. wysoko pojedynczej grammy) s zalene od niewielkiej liczby innych cech (parametrów).

Cechy kompleksowe skadaj si z wielu cech podstawowych (np. cecha „stopie starannoci” jest zalena od budowy poszczególnych znaków, nachyle, odstpów, ksztatu linii wiersza itd.) [51, s. 31]. Charakteryzuj si one wyszym poziomem intersubiektywnoci, co obnia weryfikowalno wyników bada. Cechy kompleksowe s poza tym trudniejsze do pomiaru, gdy s zalene od wielu cech prostych, które trzeba zmierzy. Pewne grupy cech z Katalogu Graficznych Cech Pisma Rcznego IES mona uzna za bardziej podstawowe a inne za kompleksowe. W przybliony sposób mona to zilustrowa umiejscawiajc dan cech na osi: cechy podstawowe — cechy kompleksowe. Mona uzyska ukad jak na Rys. 5.

Rys. 5. Pogldowe zestawienie cech pisma rcznego w odniesieniu do cech podstawowych i kompleksowych

Zwizek pomidzy wartociami cech (c) mona okrela za pomoc wspóczynnika korelacji liniowej Pearsona. Jeli wartoci cech potraktujemy jako zmienne losowe, to niech C1 i C2 bd zmiennymi losowymi o cigych rozkadach.

Ponadto niech c1i i c2i oznaczaj wartoci prób losowych tych zmiennych

(33)

¦

n i i c n c 1 1 1 1 ,

¦

n i i c n c 1 2 2 1 , (1), (2)

wówczas wspóczynnik korelacji definiuje si nastpujco:

¦

¦

¦

    n i i n i i n i i i c c c c c c c c c c r 1 2 2 2 1 2 1 1 1 2 2 1 1 2 1 , rc1c2 1, 1 . (3), (4)

Im wiksza warto tego wspóczynnika, tym wiksza jest zaleno liniowa midzy zmiennymi. Jeli wspóczynnik rc1c2 =0–0,2 oznacza to brak korelacji, dla wartoci z zakresu 0,2–0,4 korelacj okrelamy jako sab, dla 0,4–0,7 jako redni, 0,7–0,9 jako siln, a dla wartoci z przedziau 0,9–1 jako bardzo siln [32]. Natomiast

rc1c2 < 0 oznacza korelacj ujemn, tzn. jeeli warto zmiennej c1 ronie, to c2 maleje i na odwrót.

Istnieje moliwo obliczeniowego okrelania cech syntetycznych np.: typu pisma lub stopnia starannoci. Cechy syntetyczne mog si przejawia w innych grupach cech. Przykad podano w pracy [92]. Dla przykadu w pimie niestarannym marginesy tekstu bd oczywicie miay inn posta ni w pimie starannym. Istnieje wic potrzeba znalezienia zalenoci pomidzy cechami syntetycznymi, a mierzalnymi i topograficznymi [96].

Kolejn rzecz, na któr naley zwróci uwag jest zastosowanie bada pismoznawczych. W procesie identyfikacyjnych bada pisma istotnym jest wyodrbnienie waciwego zestawu cech. Do celów identyfikacji pisarza interesuj nas bardziej cechy zalene od wykonawcy tekstu. Cechy niezalene od wykonawcy tekstu, czyli cechy elementarzowe s wspólne dla wikszoci próbek pisma, w zwizku z tym maj one bardzo ma warto identyfikacyjn [78]. Eliminuje si tutaj to, co jest istotne z punktu widzenia rozpoznawania pisma.

(34)

4. Stosowane rozwizania i oprogramowanie

Zastosowanie komputerów w pismoznawstwie przynioso zmiany w zakresie rejestracji i przetwarzania obrazu pisma, w sposobie pomiaru cech pisma oraz opracowywaniu i prezentacji wyników ekspertyz [55]. Komputer wraz z odpowiednim sprztem i oprogramowaniem nadaje si np. do zastpienia aparatu fotograficznego w procesie rejestracji obrazu pisma i linijki w procesie pomiaru. Stosowane s tutaj programy graficzne ogólnego przeznaczenia (Adobe Photoshop [90], MegaCad [82], Corel Draw) czy te dedykowane, specjalistyczne programy (niemiecki system FISH [24][87] i holenderskie systemy: SCRIPT, WANDA [15][18][19]).

W przypadku praktycznej ekspertyzy pismoznawczej, kiedy nie mamy dostpu do specjalistycznego oprogramowania, przydatnym moe by wykorzystanie powszechnie dostpnego oprogramowania graficznego, biurowego i inynierskiego (np. program Matlab firmy MathWorks).

Matlab jest programem komputerowym bdcym interaktywnym rodowiskiem do wykonywania oblicze naukowych i inynierskich. Funkcjonalno Matlaba poszerzaj specjalne biblioteki zwane toolbox’ami. W dziedzinie przetwarzania obrazów i analizie pismoznawczej najbardziej przydatne s nastpujce toolbox’y: Image Processing Toolbox, Neural Network Toolbox, Fuzzy Logic Toolbox, Spline Toolbox [70][66].

Oprogramowanie biurowe moe suy do wszelakich oblicze, pomóc w analizie i wnioskowaniu oraz sporzdzi raport z ekspertyzy pismoznawczej. Przydatne mog by: edytory tekstu, arkusze kalkulacyjny. Mona tu wymieni np. programy: Word, Excel z pakietu Microsoft Office lub Write, Calc z pakietu OpenOffice.

Oprogramowanie graficzne wraz z potrzebnym sprztem pozwala nam na przeniesienie obrazu z papieru czy te innego nonika do pamici komputera. Ponadto pozwala dokona obróbki obrazu pisma oraz dokona pomiaru cech pisma.

Program Photoshop firmy Adobe jest programem do przetwarzania grafiki rastrowej, kiedy obraz jest dwuwymiarowym zbiorem elementów jednostkowych zwanych pikselami. Nadaje si on wietnie do operacji na pojedynczych pikselach obrazu, mamy w nim szczególne bogactwo rónych filtrów. W programie Adobe Photoshop do pomiarów jest przeznaczone narzdzie: Miarka (ang. Measure Tool)

(35)

(patrz Rys. 6). Pozwala na pomiar wymiarów liniowych (szeroko, wysoko) i ktowych.

Rys. 6. Przykad uycia narzdzia Miarka w programie Adobe Photoshop CE 7.0 Corel DRAW jako program grafiki wektorowej nadaje si w mniejszym stopniu do przetwarzania obrazów rastrowych, jakimi s fotografie cyfrowe, czy te skany obrazu. Jednake mamy w nim bardzo przydatne narzdzie: Wymiary (ang. Dimension

Tool). Pozwala ono na pomiar wielkoci linowych pod rónymi ktami i na pomiar

wielkoci ktowych (patrz Rys. 7.). Corel DRAW nie jest programem fotograficznym, wic zasadniczo nie pozwala na modyfikacj poszczególnych pikseli obrazu. Obrazy rastrowe naley w nim umieszcza na zasadzie importu pliku graficznego. Corel DRAW nadaje si lepiej do nanoszenia wszelakich adnotacji przy sporzdzaniu sprawozdania z ekspertyzy pismoznawczej.

(36)

Rys. 7. Zastosowanie narzdzia Wymiary w programie Corel DRAW 11

Kolejnym komputerowym programem do analizy obrazu jest system LUCIA (Laboratory Universal Computer Image Analysis) [60]. System ten wykorzystywany jest we wszelkiego rodzaju badaniach i pracach, w których podstaw jest obraz analizowanego obiektu. Oprogramowanie LUCIA pozwala na dokonywanie oceny badanych próbek na podstawie pomiarów. Wykonuje si np.: zliczanie obiektów, pomiary planimetryczne (dugo, pole powierzchni, rednica, obwód, wspóczynniki ksztatu i inne) i densytometryczne (jasno, gsto optyczna, odcie, nasycenie, poziomy skadowych RGB). LUCIA umoliwia równie edycj i zaawansowan obróbk (rastrow i wektorow) obrazu oraz posiada rozbudowane narzdzia do jego archiwizacji [109].

Wród kilku wersji tego systemu przydatnym do bada pismoznawczych jest oprogramowanie LUCIA Image (Rys. 8) do pobierania i archiwizacji obrazu z prostymi pomiarami na paszczynie jak i LUCIA Measurement, który oprócz powyszych funkcji posiada zaawansowane funkcje pomiarowe 2D. Do specjalistycznych bada w zakresie kryminalistycznego badania pisma rcznego nadaje si tene system w wersji: LUCIA Forensic [109][59].

(37)

Rys. 8. Interfejs programu LUCIA Image z przykadem uycia narzdzia do pomiarów liniowych

Przykadem specjalistycznego programu jest komputerowy system poszukiwawczo-klasyfikacyjny o nazwie Forensisches Identifierungssystem Handschriften (FISH), opracowany przez Niemiecki Federalny Urzd Kryminalny. Program pozwala na znalezienie w stosunkowo krótkim czasie w zgromadzonych zbiorach wzorów zakodowanych cech pisma wzorów najbardziej zblionych do rozpatrywanego pisma rcznego. Tryb jego pracy jest póautomatyczny. Pomiar mierzalnych cech grafizmu nastpuje w duym stopniu w sposób zautomatyzowany. Praca systemu jest wspomagana obsugujc go osob, której zadaniem jest wskazanie komputerowi znaków charakterystycznych pisma. Wskazanie to nastpuje za pomoc pióra elektronicznego i tabletu [87][24].

W interaktywnym systemie FISH mierzy si m. in. nastpujce cechy:

x Rozmiary pisma okrela si poprzez obliczenie gabarytowych rozmiarów okrelonych liter obszaru ródlinijnego („u”, „n”, „m”) poprzez zaznaczenie pierwszej kreski za pomoc pióra wietlnego. Odstp horyzontalny pomidzy pierwsz a drug kresk jest okrelany przez komputer automatycznie.

x Wysoko pisma mierzona jest na literach „e”, „i”, „n”, „u”, poprzez naniesienie przez operatora systemu dwóch linii pomocniczych.

x Nachylenie pisma zostaje okrelane poprzez naniesienie przez czowieka osi poprzez trzony liter „t”, „f” lub „d”.

(38)

x Proporcje obszarów pisma mierzone s poprzez pomiar cznej wysokoci liter „b”, „h”, „k”, „l”, „g”, „j” oraz „y”. Odjcie rodkowej wysokoci pisma nastpuje automatycznie.

x Odstpy midzy wierszami okrela si poprzez postawienie dwóch linii pomocniczych wyznaczonych za pomoc pióra wietlnego [25][42, s. 564–565]. Pewn wad systemu FISH cechujc take inne wspóczesne systemy obliczeniowe jest to, e uwzgldnia on tylko tzw. „ogólne cechy pisma” pomijajc tzw. „szczególne cechy pisma” 1. „Szczególne cechy pisma” s dystynktywne, czyli maj due znaczenie przy procesie identyfikacji (rozpoznawania) pisma rcznego [24, s. 200].

System FISH jest cigle rozwijany i kryminalistycy wi due nadzieje z moliwoci penej automatyzacji klasyfikacji pisma [27, s. 1008–1009].

Naley take wspomnie program, który zosta opracowany ostatnio w Polsce przez Instytut Ekspertyz Sdowym w Krakowie. Program GRAPHOLOG suy do wspomagania pracy eksperta pisma. Prace tutaj ju s bardzo zawansowane jak informuj twórcy tego systemu. Jest to system, który suy do przetwarzania obrazu pisma i pomiaru interaktywnego oraz wstpnej statystycznej obróbki danych [13].

1

(39)

5. Materia badawczy

Dowód tez pracy zostay oparty na wynikach bada nad próbkami pisma rcznego. Zebrano i opracowano szeroki materia badawczy. Do kadego eksperymentu przygotowano kilka zestawów próbek pisma.

5.1. Zestaw 1.

Materia badawczy stanowiy pobrane rkopisy od grupy studentów w wieku dwudziestu kilku lat (22, 23 lata). Próbki pisma zostay zoone na nieliniowanym, biaym papierze formatu A4. Od kadego probanta (probantki) pobrano rkopis o tej samej treci; fragmenty „Maego Ksicia”, Antoine de Saint-Exupery, w tum. Jana Szwykowskiego:

„Gdy miaem sze  lat, zobaczyem pewnego razu wspaniay obrazek w ksice opisujcej puszcz dziewicz. Ksika nazywaa si "Historie prawdziwe". Obrazek przedstawia wa boa, poykajcego drapiene zwierz.

Doro li poradzili mi, abym porzuci rysowanie wy zamknitych oraz otwartych i abym si raczej zaj geografi, histori, arytmetyk i gramatyk. W ten sposób majc lat sze , porzuciem wspania karier malarsk. Zraziem si niepowodzeniem rysunku numer 1 i numer 2. Doro li nigdy nie potrafi sami zrozumie. A dzieci bardzo mczy konieczno  staego obja niania. Musiaem wybra sobie inny zawód: zostaem pilotem. Lataem po caym wiecie i musz przyzna, e znajomo  geografii bardzo mi si przydaa. Potrafiem jednym rzutem oka odróni Chiny od Arizony. Ta wiedza oddaje due usugi, szczególnie wówczas, gdy si bdzi noc.

Zawód pilota da mi okazj do licznych spotka z wieloma powanymi ludmi. Wiele czasu spdziem z dorosymi. Obserwowaem ich z bliska. Lecz to nie zmienio mej opinii o nich. Gdy spotykaem doros osob, która wydawaa mi si troch mdrzejsza, robiem na niej do wiadczenie z moim rysunkiem numer 1, który stale nosiem przy sobie. Chciaem wiedzie, czy mam do czynienia z osob rzeczywi cie pojtn. Lecz za kadym razem odpowiadano mi: — To jest kapelusz. — Wobec tego nie rozmawiaem ani o wach boa, ani o lasach dziewiczych, ani o gwiazdach. Staraem si by na poziomie mego rozmówcy. Rozmawiaem o brydu, golfie, polityce i krawatach. A dorosy by zadowolony, e pozna tak rozsdnego czowieka” [100].

Tekst ten zawiera 227 wyrazów. Z uwagi na to, e w dalszych badaniach pominito wyrazy jednoliterowe oraz uwzgldniono to, e u niektórych piszcych

Cytaty

Powiązane dokumenty

Wrzesiński, Wojciech Przyczynki do problemu wschodniopruskiego w czasie II wojny światowej Komunikaty Mazursko-Warmińskie nr 1,

Hulewicz omówił rolę Seminarium Historycznego UJ w rozwoju nauki polskiej, rolę znaczoną nazwis- kami Stanisława Smolki, Wincentego Zakrzewskiego, Stanisława Krzyżanowskiego,

The first time that the generation gap and the ideological differences that underlay it became starkly apparent was in May 1967, when the National Architecture Students conference

In nomadic dwellings with their flexible physical features (tents), the qualitative and quantitative features of behavioral settings and spaces can be rapidly realized, changed

Ich kann auch die zusammenfassende Meinung des Verfassers nicht teilen: „Die Betrachtung hat deutlich gezeigt, dass sich in den polnischen Lehrwerken für DaF

Zestawienie wybranych zadań i wskaźników w zakresie wydatków bieżących, stanowiących źródło informacji o warunkach życia mieszkańców gminy, prezen- tuje tabela 2..

Porównanie ilościowe próbek pełnego proszku mlecznego w odniesieniu do zawartości azotanów i azotynów z poszczegól- nych zakładów wg kryterium krajowego (Rozporządzenia

is dat de hoogte niet zo groot wordt en de absorber installa- tie eenvoudiger is. Ook voor dit fluide bed moet in een aantal paralelIe units gewerkt