• Nie Znaleziono Wyników

Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych

N/A
N/A
Protected

Academic year: 2021

Share "Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych"

Copied!
12
0
0

Pełen tekst

(1)

Streszczenie

W artykule przedstawiono metodĊ adaptacyjnego uczenia maszynowego do rozpoznawania i przetwarzania obrazów w procesach automatycznego opracowywania przesyłek pocztowych. Ze wzglĊdu na proces automatycznego rozpoznawania adresu, najistotniejszy segmentem linii jest zintegrowana maszyna czytająca z wideokodowaniem za pomocą modułu optycznego rozpoznawania znaków automatycznie odczytuje adres przesyłki. Mała sprawnoĞü tego modułu podnosi koszty i zmniejsza przepustowoĞü całego systemu opracowania przesyłek. Zaproponowano metodĊ bazującą na wydzielaniu cech znaków na podstawie analizy z wykorzystaniem zbiorów przybliĪonych. Natomiast dane z procesu wideokodowania pozwalają na aktualizacjĊ bazy wzorców poszczególnych klas znaków.

Słowa kluczowe: sortowanie przesyłek, uczenie maszynowe, zbiory przybliĪone 1. Wprowadzenie

Systemy rozpoznawania obrazów są aktualnie bardzo dynamicznym obszarem działalnoĞci badawczej. Rozpoznawanie i przetwarzanie obrazów jest powszechnie wykorzystywane w technice komputerowej do identyfikacji dokumentów w urzĊdach i instytucjach uĪytecznoĞci publicznej. Kierunki rozwoju systemów rozpoznawania uwzglĊdniają moĪliwoĞci rozpoznawania pisma jak równieĪ umoĪliwiają ograniczenie iloĞci przechowywanych danych. Obecnie najwiĊkszymi od-biorcami systemów optycznego rozpoznawania pisma są instytucje pocztowe. Pojawiają siĊ moĪ-liwoĞci zastosowania systemów automatycznego rozpoznawania znaków do sortowania przesyłek na podstawie adresu bez wpisanego kodu pocztowego.

2. Procesy przesyłania przesyłek w pocztowych systemach transportowych

Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyjĊty przez operatora pocztowego w celu przemieszczenia i dorĊczenia adresatowi. Zgodnie z tą definicją przesyłka pocztowa moĪe byü formą łącznoĞci polegającej na zdalnym przekazywaniu dokumentów lub przedmiotów przy uĪyciu Ğrodków transportu lądowego, wodnego, powietrznego lub elektronicz-nego.

(2)

W procesie przemieszczania, przesyłania przesyłek od nadawcy do adresata wystĊpują nastĊ-pujące zasadnicze fazy:

• gromadzenie, • segregacja wstĊpna, • przemieszczanie, • segregacja, • dorĊczanie.

W procesie technologicznym przesyłania przesyłek listowych istotne znaczenie ma jakoĞü tego procesu, którego miarą jest czas przebiegu przesyłki od nadawcy do adresata. W procesie przesy-łania przesyłek moĪna wyróĪniü dwie zasadnicze fazy: transport przesyłek i ich opracowywanie. Na podstawie analizy powyĪszych faz ze wzglĊdu na długoĞü czasu przebiegu przesyłek, moĪna stwierdziü, Īe najbardziej czasochłonne są dwa etapy:

– przewóz przesyłek miĊdzy wĊzłami rozdzielczymi, – opracowywanie przesyłek w wĊzłach rozdzielczych.

W całym procesie pocztowym [7] wiodącą rolĊ pełnią WĊzły Ekspedycyjno – Rozdzielcze (WER), poniewaĪ opracowują one wiĊkszoĞü przepływających w systemie pocztowym przesyłek. W wĊzłach zbiegają siĊ strumienie przesyłek pochodzących niemalĪe ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER są one rejestrowane w systemie teleinforma-tycznym. Dokonuje siĊ tego na stanowiskach recepcyjnych, przy uĪyciu skanerów kodów kresko-wych, które umieszczane są na opakowaniach zbiorczych, a takĪe na niektórych rodzajach przesy-łek. DziĊki temu fizycznemu strumieniowi ładunków przepływającemu w sieci logistycznej, gene-rowane są informacje o tych ładunkach, a takĪe o ich zawartoĞci, co stanowi jednoczeĞnie podsta-wĊ dla funkcjonowania systemu Ğledzenia przesyłek, a takĪe bazĊ danych dla działaĔ analitycz-nych, sprawozdawczych i reklamacyjnych [2].

Podstawowe elementy składowe WER to: • zintegrowany system teleinformatyczny, • kompleksowy system transportu wewnĊtrznego,

• wielofunkcyjne maszyny sortownicze do rozdziału listów o rozmiarach standardowych (ekonomicznych, priorytetowych, ekonomicznych i in.), listów niestandardowych (flatów), paczek,

• urządzenia wspomagające proces pocztowy jak system komunikacji i lokalizacji Ğrodków transportu, system Ğledzenia przesyłek [7].

Ze wzglĊdu na pracochłonnoĞü procesu, terminy czasowe dostarczania przesyłek najwiĊcej uwagi wymaga proces sortowania przesyłek listowych. Maszyny do automatycznego opracowywa-nia przesyłek listowych są ustawione jako niezaleĪne segmenty:

• maszyna rozdzielająca i licująco – stemplująca CFC, • zintegrowana maszyna czytająca z wideokodowaniem IRV, • maszyna do rozdziału szczegółowego FSM,

(3)

3. Rozdział przesyłek listowych w WĊzłach Ekspedycyjno – Rozdzielczych (WER)

Mechanizacja i automatyzacja procesów technologicznych to Ğrodki, jakie wiele administracji pocztowych na Ğwiecie z powodzeniem zastosowało w celu ułatwienia pracy, a przede wszystkim dla zapewnienia terminowoĞci przebiegu przesyłek. Poczta Polska proces ten rozpoczĊła w 1992 r. Do chwili obecnej automatyczne rozdzielnie listowe pracują w nastĊpujących wĊzłach: Warszawa, Katowice, PoznaĔ, Kraków oraz ŁódĨ. Wszystkie te wĊzły są wyposaĪone w maszyny dostarczane przez niemiecką firmĊ Siemens Electrocom z wyjątkiem wĊzła w Warszawie, który wyposaĪono w liniĊ do rozdziału przesyłek listowych firmy japoĔskiej Nippon Electric Company (NEC).

Rysunek 1. Maszyna rozdzielająca i licująco – stemplująca CFC ħródło: Materiały inf. Siemens.

Proces opracowywania listów w WER-ach moĪna podzieliü na dwa etapy. W pierwszym na-stĊpuje wstĊpna selekcja na przesyłki standardowe nadające siĊ do sortowania maszynowego oraz przesyłki o nietypowych kształtach i rozmiarach przeznaczonych do opracowania rĊcznego. Typo-we przesyłki stemplowane są w maszynie CFC, gdzie na podstawie odblasku farby fluorescencyj-nej i perforacji znaczka naklejonego na liĞcie sprawdzane jest czy opłata została uiszczona. Umieszczenie odcisku datownika koĔczy pierwszy etap.

(4)

W dalszej kolejnoĞci w maszynie czytającej z wideokodowaniem IRV, system za pomocą mo-dułu optycznego rozpoznawania znaków (ang. OCR – Optical Character Recognition) automatycz-nie odczytuje adres. Rząd poziomych, pomaraĔczowych kresek w dolnej czĊĞci listu lub pocztówki to efekt odczytania kodu pocztowego i nazwy miejscowoĞci. Nanosi je, po elektronicznym prze-tworzeniu, drukarka natryskowa.

Nadrukowany kod kreskowy posłuĪy nastĊpnym modułom LSM (ang. Letter Sorting Machine) i FSM (ang. Flat Sorting Machine) do koĔcowego (szczegółowego) rozdzielenia przesyłek. Posor-tują one i pogrupują korespondencjĊ do wybranych obszarów, np. rejonów dorĊczeĔ i pocztowych urzĊdów oddawczych.

Rysunek 2. Zintegrowana maszyna czytająca z modułem OCR i z wideokodowaniem IRV W przypadku kiedy OCR nie moĪe sobie poradziü z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagają-cych odczyt automatyczny, gdzie na ekranach monitorów pojawiają siĊ strony adresowe przesyłek pocztowych. Operatorzy wpisują kody pocztowe, a w przypadku rozdziału przesyłek dla niektó-rych miast – nazwĊ ulicy i numer. CałoĞü tworzy tzw. wideokodowanie (ang. Video Coding Sys-tem) [5].

Podstawowe problemy związane z automatycznym sortowaniem przesyłek pocztowych doty-czą znadoty-czącego wpływu sprawnoĞci modułu OCR na efektywnoĞü pracy systemu. W przypadku duĪej iloĞü przesyłek adresowanych odrĊcznym pismem, sprawnoĞü automatycznego odczytu przy uĪyciu modułu OCR znacząco spada.

(5)

Rysunek 3. Maszyna do rozdziału szczegółowego FSM

(6)

4. Parametry techniczno-eksploatacyjne maszyn do automatycznego opracowywania przesyłek listowych

Maszyny do automatycznego opracowywania są ustawione jako niezaleĪne moduły. Parametry technologiczne poszczególnych modułów są nastĊpujące (parametry podano przykładowo dla maszyn firmy NEC, dla maszyn firmy Siemens zasadniczo siĊ nie róĪnią):

a) maszyna dzielenia wstĊpnego (IRV):

• prĊdkoĞü przetwarzania – 40 000 szt./h (max 45 000 szt./h), • poziom odczytu adresu maszynowego – 80% lub wiĊcej,

• współczynnik błĊdu odczytu adresu maszynowego – 0,5 % lub mniej,

• poziom odczytu adresu odrĊcznego, gdy kod PNA (Pocztowy Numer Adresowy) jest umieszczony w kratkach kodowych – 83% lub wiĊcej,

• poziom odczytu adresu odrĊcznego bez kodu PNA w kratkach kodowych – 40 % lub wiĊcej

• współczynnik błĊdu adresu odrĊcznego – 1 % lub mniej,

• współczynnik odczytu rozszerzonego kodu kreskowego – 98,3 % lub wiĊcej,

• pojemnoĞü pamiĊci zeskanowanych obrazów przesyłek – 240 tys. obrazów przesyłek. b) maszyny do rozdziału szczegółowego (FSM):

• prĊdkoĞü przetwarzania – 40 000 szt./h (max 45 000 szt./h), • programy sortujące do – 100,

• liczba zasobników – 360 (8 drukarek etykiet), • wskaĨnik odczytu kodu – 98,3 % dla kodu 5-cyfr, • wskaĨnik błĊdnego sortowania – 0,5% lub mniej, • wskaĨnik błĊdów odrzutów – 0,2%

5. Parametry adresowania przesyłek ze wzglĊdu na skutecznoĞü ich rozpoznawania

Wymagania dotyczące przesyłki listowej, bloku adresowego oraz dostosowanie znaczków pocztowych zostały ĞciĞle sprecyzowane i uregulowane w obowiązujących przepisach poczto-wych. Przepisowy format przesyłki listowej dostosowanej do automatycznego rozdziału to:

• długoĞü: 138 – 240 mm, • wysokoĞü: 88 – 165 mm, • gruboĞü: 0,16 – 5 mm, • masa maksymalna: 50 g.

Wymagania bloku adresowego są nastĊpujące:

• pomiĊdzy poszczególnymi wierszami bloku adresowego nie naleĪy pozostawiaü odstĊpów,

• początki wierszy w bloku adresowym winny leĪeü w jednej linii, • nie naleĪy uĪywaü podkreĞleĔ,

• PNA i nazwĊ miejscowoĞci naleĪy umieĞciü w ostatnim wierszu, • PNA naleĪy wpisywaü we właĞciwe, wstĊpnie nadrukowane okienka, • wiersze adresu nie mogą przebiegaü ukoĞnie,

(7)

• w przypadku stosowania kopert z okienkami, adres musi byü w całoĞci widoczny w okienku.

Rysunek 5. Wzór strony czołowej listu nadającego siĊ do sortowania maszynowego ħródło: Opracowanie własne.

Ponadto podane są zalecenia, na które naleĪy zwróciü uwagĊ podczas adresowania przesyłek: adres pisz czytelnym pismem, kod i miejscowoĞü pisz drukowanymi, prostymi, oddzielnymi literami, nie podkreĞlaj adresu lub jego czĊĞci, pierwsze litery poszczególnych linii adresu muszą tworzyü jedną kolumnĊ, poniĪej kodu i nazwy miejscowoĞci nie umieszczaj Īadnych napisów, rysunków czy naklejek, uĪywaj niebieskiego lub czarnego tuszu, nie pisz adresu kolorem czerwonym (i jego pochodnymi), gdyĪ maszyny nie odczytają adresu w tym kolorze, naleĪy unikaü drukarek igłowych (nanoszone przez nie znaki są nieczytelne dla maszyny sortującej korespondencjĊ), wysokoĞü czcionki uĪytej przy adresowaniu nie powinna byü mniejsza niĪ 2,5 mm i nie wiĊksza niĪ 4,7 mm, logo, napisy reklamowe, znaki drukarskie, itp. powinny byü umieszczone z lewej strony bloku adresowego.

Kod pocztowy (pocztowy numer adresowy) jest to ciąg cyfr (rzadziej liter i cyfr) dodawany do adresu, mający ułatwiaü sortowanie przesyłek. Format i zasady umieszczania kodów pocztowych są róĪne w róĪnych krajach. W Polsce system kodów pocztowych (Pocztowe Numery Adresowe – PNA) wprowadzono 1 stycznia 1973 na mocy rozporządzenia nr 89 Ministerstwa ŁącznoĞci z 17 listopada 1972. Kody pocztowe mają format dd-ddd, gdzie d oznacza cyfrĊ, i umieszcza siĊ je z lewej strony nazwy miejscowoĞci, w której znajduje siĊ pocztowy urząd oddawczy. Pierwsza cyfra okreĞla okrĊg pocztowy, druga strefĊ kodową, która wskazuje czĊĞü okrĊgu którym jest okreĞlony obszar połoĪony wzdłuĪ linii komunikacyjnych lub miasto wojewódzkie, trzecia to

... .

Pani Janina Nowak Ul.Cicha 132 m. 16 62-200 Gniezno ...

Strefa dla opłaty pocztowej ramka o wysokoĞci 40 mm Blok adresowy Strefa kodowania o wys. 15 mm Maks. dłu-goĞü strefy adresowej 140 mm Znaczek

(8)

sektor kodowy obejmująca obszar podległy rozdzielni sektorowej, a w dziewiĊtnastu najwiĊkszych miastach umowne czĊĞci miast. Czwarta i piąta wskazują placówkĊ pocztową i jej obszar działania lub jednostkĊ dorĊczeniową.

Automatyczne rozpoznawanie kodów pocztowych jest kluczowym elementem systemu sortowania, bowiem od niego zaleĪy skutecznoĞü całego systemu. Obecna technologia rozpoznawania kodów opiera siĊ na systemach ICR, które jest odmianą systemów OCR wykorzystywanych w procesie przetwarzania danych z dokumentów typu formularze. Metody rozpoznawania znaku oparte są zwykle na technologiach sieci neuronowych przy wsparciu tablic walidacji, które podwyĪszają poziom rozpoznania pola. W spotykanych rozwiązaniach skutecznoĞü rozpoznawania kodów pocztowych wynosi 40 – 90% [1][3][4][6][8][9]. Główne problemy związane z rozpoznawaniem kodów pocztowych to dobór algorytmów lokalizacji pola adresowego, stosowanie eliminacji zniekształceĔ etapu akwizycji np. filtracji, proces segmentacji znaków, wybór metody rozpoznawania kodu pocztowego, stosowanie tablic walidacyjnych. 6. Klasyfikacja stanu przesyłki ze wzglĊdu na proces odczytu adresu

W zintegrowanej maszynie czytającej IRV z modułem OCR i z wideokodowaniem odbywa siĊ automatycznie czytanie adresu przesyłki listowej. WyróĪnia siĊ dwa stany przeczytania adresu przesyłki listowej:

• w przypadku automatycznego odczytania adresu za pomocą modułu OCR, drukarka natryskowa po elektronicznym przetworzeniu nadrukowuje pasek kodu kreskowego w postaci rzĊdu poziomych, pomaraĔczowych kresek w dolnej czĊĞci listu lub pocztówki. Nadrukowany kod kreskowy posłuĪy nastĊpnym modułom LSM i FSM do koĔcowego (szczegółowego) rozdzielenia przesyłek.

• JeĪeli automatyczny odczyt adresu przesyłki przez moduł OCR nie powiedzie siĊ, wówczas jest ona kodowana rĊcznie na stanowisku wideokodowania.

Z przedstawionej klasyfikacji stanu przesyłki wynika, Īe moduł OCR jest kluczowym elemen-tem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Mała sprawnoĞü tego modułu podnosi koszty i zmniejsza przepustowoĞü całego systemu opracowania przesyłek.

Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwiązaĔ umoĪliwiających podniesienie skutecznoĞci automatycznego systemu pocztowego w związku z tym zaproponowano zastosowanie modułu rozpoznającego znaki uwzglĊdniającego aktualizacjĊ bazy danych dla poszczególnych klas obiektów przez wybór cech z wykorzystaniem zbiorów przybliĪo-nych (ang. rough set). Cechy obiektu (np. obrazu znaku) mogą byü uzyskiwane z wykorzystaniem transformaty Trace [10][11] a nastĊpnie z wykorzystaniem zbiorów przybliĪonych przeprowadza siĊ analizĊ wszystkich znanych przypadków (znaków) wystĊpujących w obrĊbie danej klasy, które pozwolą wyszczególniü tylko informacje niezbĊdne do dyskryminacji znaków. Na rys. 6 przedsta-wiono schemat zaproponowanej metody.

(9)

Zbiór uczący (osobny dla kaĪdej

klasy znaków) D1 D2 Dd C1 C2 Cc Redukty (Reducts) Reguły (Rules) Rozkład (Decompsition) R1 R2 Rr Baza reduktów Dla kaĪdej z klas obiektów Baza reguł i rozkładów dla kaĪdej z klas obiektów D1 D2 Dd C1 C2 Cc Klasyfikacja obiekt/nie obiekt R1 R2 Rr Dane obiektu (znaku nieznanego) D1 D2 Dd C1 C2 Cc Klasyfikacja obiekt/nie obiekt Blok decyzyjny R1 R2 Rr D1 D2 Dd C1 C2 Cc Klasyfikacja obiekt/nie obiekt R1 R2 Rr Klasa obiektu

Uczenie Baza danych Klasyfikacja

Rysunek 6. Schemat zaproponowanej metody ħródło: Opracowanie własne.

Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybliĪonych. Podstawowe działania na zbiorach przybliĪonych są takie same, jak działania na zbiorach klasycznych, lecz, dodatkowo wprowadza siĊ kilka nowych pojĊü, które nie są uĪywane w przypadku zbiorów klasycznych, mianowicie:

(10)

Relacja nierozróĪnialnoĞci: Dla kaĪdego podzbioru cech

B

A

( )

{

,

:

(

)

(

)

}

)

(

B

x

y

U

2

a

x

a

y

IND

B a

=

=

∈ (1)

RelacjĊ nierozróĪnialnoĞci elementów x i y zapisujemy w postaci xIND(B)y (x jest w relacji nierozróĪnialnoĞci z y w zbiorze cech B), oznacza ona, Īe elementy x oraz y mają te same wartoĞci podzbioru cech B, innymi słowy ze wzglĊdu na zbiór cech B, elementów x i y nie da siĊ miĊdzy sobą rozróĪniü,

Dolne przybliĪenie zbioru X w przestrzeni aproksymacji (S):

[ ]

{

x

U

x

X

}

X

S

(

)

=

:

IND(B)

(2)

jest to najwiĊkszy podzbiór w S zawarty w X, Górne przybliĪenie zbioru X w przestrzeni aproksymacji (S):

[ ]

{

:

0

}

)

(

X

=

x

U

x

( )

X

S

IND B (3)

Brzeg zbioru przybliĪonego:

)

(

)

(

)

(

X

S

X

S

X

Bnd

=

(4)

Powstaje zatem moĪliwoĞü zdefiniowania zbioru w oparciu o jego przybliĪenie dolne i górne. Dla kaĪdej z klas rozpoznawanych obiektów tworzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazĊ danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane są w grupach wszystkich klas. NajwiĊksza liczba wystąpieĔ wskazuje na klasĊ badanego obiektu (znaku). W przypadku zastosowaĔ pocztowych zestawy uczące poszczególnych klas uzupełniane są przez wzorce z wideokodowania i ponowne wydzielenie zbiorów reduktów i rozkładów dla poszczególnych klas obiektów.

7. Podsumowanie

W artykule przedstawiono metodĊ adaptacyjnego uczenia maszynowego do rozpoznawania i przetwarzania obrazów w procesach automatycznego opracowywania przesyłek pocztowych. Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyjĊty przez operatora pocztowego w celu przemieszczenia i dorĊczenia adresatowi. W całym procesie pocztowym przemieszczania przesyłek od nadawcy do adresata wiodącą rolĊ pełnią WĊzły Ekspedycyjno – Rozdzielcze (WER), gdzie zbiegają siĊ strumienie przesyłek pochodzących niemalĪe ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER są one rejestrowane w systemie teleinformatycznym. Dokonuje siĊ tego na stanowiskach recepcyjnych, przy uĪyciu skanerów kodów kreskowych. Ze wzglĊdu na pracochłonnoĞü procesu, terminy czasowe dostarczania przesyłek najwiĊcej uwagi wymaga proces sortowania przesyłek listowych. Po ich przyjĊciu do

(11)

WER na liniach do automatycznego rozdziału odbywa siĊ proces sortowania przesyłek na poszczególne kierunki adresowe. Linie do automatycznego rozdziału zestawione są z maszyn ustawione jako niezaleĪne segmenty. Ze wzglĊdu na proces automatycznego rozpoznawania adresu, najistotniejszy segmentem linii jest zintegrowana maszyna czytająca z wideokodowaniem IRV. W maszynie czytającej z wideokodowaniem IRV, system za pomocą modułu OCR automatycznie odczytuje adres. W przypadku kiedy OCR nie moĪe sobie poradziü z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagających odczyt automatyczny, gdzie na ekranach monitorów pojawiają siĊ strony adresowe przesyłek pocztowych. Moduł OCR jest kluczowym elementem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Mała sprawnoĞü tego modułu podnosi koszty i zmniejsza przepustowoĞü całego systemu opracowania przesyłek. Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwiązaĔ umoĪliwiających podniesienie skutecznoĞci automatycznego systemu pocztowego.

Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybliĪonych, dziĊki temu pojawia siĊ moĪliwoĞü zdefiniowania zbio-ru cech w oparciu o przybliĪenie dolne i górne. Dla kaĪdej z klas rozpoznawanych obiektów two-rzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazĊ danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane są w grupach wszyst-kich klas. Zastosowane zbiorów przybliĪonych pozwala na poszukiwanie ukrytych zaleĪnoĞci po-miĊdzy danymi i podejmowanie decyzji w sytuacji istnienia niepełnych lub czĊĞciowo sprzecznych danych.

Bibliografia

1. Bouchaffra D., Govindaraju V., Srihari S., 1999. Recognition of strings using nonstationary Markovian models: an application in ZIP code recognition. IEEE Computer Society Confer-ence on Computer Vision and Pattern Recognition 2, s. 2174–2183.

2. Chaberek M., 2002 Makro- i mikroekonomiczne aspekty wsparcia logistycznego. Wydawnic-two Uniwersytetu GdaĔskiego.

3. Filatov A., Volgunin A., 1997. Handwritten ZIP code recognition. ICDAR 4, s. 766–770. 4. Forella G., 2000. Word perfect, Postal Technology. UKIP Media & Events Ltd. UK.

5. Ishikura T., Adachi T., 1999. Video Coding technology for postal automation system: Special issue on postal automation technology. NEC research and development 40, Tokyo, s. 176–

180.

6. Maszewski M., Miciak M., 2006. Rozpoznawanie danych teleadresowych z wykorzystaniem współczynników Fouriera i zespolonej dyskretnej transformacji falkowej opartej na projekcji. Techniki Przetwarzania Obrazu. s. 381–386.

7. Michalski K., 2004. Rola centrum ekspedycyjno-rozdzielczego w kreowaniu wartoĞci sieci logistycznej Poczty Polskiej, Instytut logistyki i Magazynowania, PoznaĔ.

8. Miciak M., Marchewka M., 2004. The recognition of postal code using Fourier transform method., XII Konferencja Sieci i Systemy Informatyczne, ŁódĨ, s. 461–468.

9. Mitsu Y., Tatsuro S., Isao Y., 1994. A recognition system for Japanese Zip code using Arc features. IEICE Transactions on Information and Systems. s. 810–816.

(12)

10. Bok-Suk Shin., Effective feature extraction by trace transform for insect footprint recognition, Bio-Inspired Computing: Theories and Applications 2008, s. 97–102.

11. Petrou M., Piroddi R., Talebpour A., Texture recognition from sparsely and irregularly sam-pled data, Computer Vision and Image Understanding archive, 2006, s. 95–104.

THE ADAPTIVE MACHINE LEARNING METHOD FOR POSTAL SORTING SYSTEMS Summary

In this paper we present a method of adaptive machine learning to recognize images in the automatic process of mail sorting. Due to the automatic address recognition, the most important segment of this proces is adress reading through optical character recognition module. Low efficiency of this module raises costs and reduces the throughput of the system. Proposed a method based on the characer features obtained on the basis of rough sets analysis. However, data from the videocoding allow you to update the database patterns of individual character classes.

Keywords: mail sorting, machine learning, rough sets Mirosław Miciak

Roman Wiatr Rafał Boniecki

Zakład InĪynierii Poczty

Wydział Telekomunikacji i Elektrotechniki

Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy ul. Kordeckiego 20, 85-225 Bydgoszcz

e-mail: mirosław.miciak@utp.edu.pl roman.wiatr@utp.edu.pl rafal.boniecki@utp.edu.pl

Cytaty

Powiązane dokumenty

OP-2 Pracownia Optyki Przyrządowej Temat Pomiary za pomocą niwelatora optycznego. Strona z

Zmienne objaśniające bazowały na liczbie punktów i dotyczyły ogólnej jakości drużyny (średnia liczba punktów w trzech ostatnich sezonach), formy drużyny (średnia liczba

Dostępnych jest wiele metod umożliwiających prze- prowadzenie weryfikacji działania klasyfikatora, jak np. podział zbioru danych na dwie odrębne części, gdzie

Ze składniowo-semantycznej funkcji łączącej na poziomie stylistycznym tekstu może wynikać także inna rola, taka jak w przykładzie chmury a stokrocie (189), gdzie

(2.2.4) Wyznacz kolejne serie, po jednej o tym samym numerze z każdego niewyczerpanego pliku wejściowego;. (2.3) Zamień pliki wyjściowe

(2.2.4) Wyznacz kolejne serie, po jednej o tym samym numerze z każdego niewyczerpanego pliku wejściowego;. (2.3) Zamień pliki wyjściowe

„Postawa Radziwiłłów w obec rokoszu Lu­ bomirskiego była dwuznaczna, charakteryzowała się niezdecydowaniem ” konklu­ duje Rachuba, — lecz Bogusław Radziw iłł,

W ątpli­ w ości budzi niejednokrotnie sposób pracy autora ze źródłami, które bywają nie­ kiedy przyw oływ ane dla dowiedzenia tez, które literatura przedmiotu