• Nie Znaleziono Wyników

Porównanie korekty tekstu z istniejącymi aplikacjami dla języka polskiego

W dokumencie Index of /rozprawy2/11645 (Stron 118-123)

Podobnie jak dla języka angielskiego, porównanie efektywności korekty tekstu przeprowadzono również dla języka polskiego. W tym celu do wykorzystano aplikacje wymienione poniżej. Warto zwrócić uwagę, że ich opisy są również subiektywnymi opiniami autorów aplikacji i przedstawiają ich własne przeświadczenia.

• Language Tool (https://languagetool.org/) - aplikacja ta wykrywa ponad 1000 błędów w polskich tekstach. Może posłużyć ona do korekty stylistycznej, gramatycznej, ortograficznej

oraz typograficznej. Wskazuje ona literówki kontekstowe, które są niewidoczne dla standardowych korektorów pisowni.

• iKorektor (https://ikorektor.pl) - internetowe narzędzie, które sprawdza tekst w języku polskim pod kątem błędów językowych i automatycznie poprawia ewidentne błędy ortograficzne, interpunkcyjne, typograficzne, literówki, uzupełnia polskie znaki diakrytyczne itp.

• KorektorOnline (https://www.korektoronline.pl) – kolejny serwis, który wyszukuje i zaznacza błędy pisowni, jak również wiele podstawowych błędów gramatycznych i stylistycznych w tekstach napisanych w języku polskim. Aplikacja sugeruje także możliwe poprawki w tekście. Warto wspomnieć, że autorzy zaznaczają, iż w swojej aplikacji wykorzystują narzędzia Hunspell, DICTION i LanguageTool. Ostatnie z nich stanowi osobną aplikację, która została opisana w pierwszym punkcie tej listy.

• Ortograf (https://www.ortograf.pl) - jest to system sprawdzający podany tekst pod względem poprawności ortograficznej, stylistycznej, gramatycznej i typograficznej. Dla języka polskiego ortografia i interpunkcja sprawdzane są pod kątem ponad 1000 reguł. Autorzy zaznaczają jednak, że znalezione błędy i propozycje poprawek należy traktować jedynie jako sugestie. Zastosowany algorytm nie znajduje wszystkich błędów i w wielu przypadkach nie jest w stanie zaproponować poprawnej pisowni. Użytkownik korzystając z witryny, robi to na własne ryzyko.

Podobnie jak dla języka angielskiego, w języku polskim wprowadzono tekst z różnymi typami błędów, celem sprawdzenia poprawności korekty tekstu. Tekst, który został poddany ocenie, brzmiał „JAcek rozmawia z alicją. Tomek ma czarnego kot. kogo szuka Piotr. Mówiłem że jutro jest sobota.”. Można w nim rozpoznać następujące błędy:

• JAcek – słowo znajduje się w słowniku j. polskiego, lecz zostało błędnie wpisane. Poprawnie powinno brzmieć „Jacek”;

• alicją – to słowo podobnie jak słowo Jacek, zostało źle wprowadzone. Powinno rozpoczynać się od dużej litery. Poprawnie powinno brzmieć „Alicją”;

• czarnego kot – w tym przypadku słowo „kot” powinno zostać odmienione i poprawnie powinno zostać zapisane „czarnego kota”;

• zdanie „kogo szuka Piotr.” jest zdaniem pytającym, a więc zamiast kropki powinno kończyć się znakiem zapytania „?”;

• Mówiłem że – przed słowem „że” stawiamy przecinek. Wobec tego poprawny początek tego zdania powinien zostać zapisany w następujący sposób „Mówiłem, że”.

Wyniki poprawy tekstu poszczególnych aplikacji zostały zaprezentowane poniżej. Wynik poprawy tekstu za pomocą wykonanej aplikacji przedstawiono na rysunku 35.

Jak można zauważyć, zaproponowana aplikacja poprawiła wszystkie błędy występujące w tekście.

Na kolejnych rysunkach 36., 37. oraz 38. przedstawiono wyniki korekty tekstu dla aplikacji LanguageTool, KorektorOnline.pl oraz portalu Ortograf.pl.

Można również dostrzec, że zaprezentowana została ta sama korekta tekstu dla wszystkich trzech aplikacji. Sposób wyświetlania błędów jest również bardzo podobny. Może to być związane Rysunek 36: Znalezione błędy w tekście przez apllikację LanguageTool

Rysunek 37: Wynik korekty tekstu przez portal KorektorOnline.com

z tym, iż aplikacja KorektorOnline.pl wprost wskazuje, że do swojej korekty tekstu wykorzystuje aplikację LanguageTool. Niestety aplikacje te zaznaczają jedynie błędne słowa, nie wprowadzając automatycznej korekty (choć po kliknięciu w słowo prezentują jedynie jedną opcję poprawy).

Ostatnią aplikacją, dla której przeprowadzono sprawdzenie korekty tekstu, był portal iKorektor.pl. Wynik działania aplikacji został zaprezentowany na rysunku 39. Program ten, w odróżnieniu od poprzednich wprowadza częściową automatyczną korektę tekstu. Niestety jako jedyny zaznacza jako błędne słowo „sobota”, które jest poprawne.

W tabeli 3. zebrano szczegółowe informacje odnośnie wykrytych błędów oraz możliwości ich poprawy.

Tabela 3: Porównanie otrzymanych wyników korekty tekstu dla języka polskiego. Algorytmy oparte na grafie LHG Aplikacje LanguageTool, KorektorOnline.pl, Ortograf.pl Aplikacja iKorektor.pl

JAcek TAK Jacek, Jajek, Jarek,... TAK

alicją TAK Alicja, Alicją, Alicjom TAK

czarnego kot TAK NIE NIE

kogo TAK TAK TAK

Pytajnik na końcu

zdania TAK NIE NIE

Przecinek dla „mówiłem że”

TAK TAK TAK

sobota Nie wymaga poprawy Nie wymaga poprawy sobotą

Dla poszczególnych aplikacji uzyskano następujący wynik poprawy: • Algorytmy oparte na grafie LHG – 6/6 = 100%,

• Aplikacje LanguageTool, KorektorOnline.pl, Ortograf.pl – 3/6 = 50%,

• Aplikacja iKorektor.pl 4/6 = 66%, niemniej wykryty został dodatkowo niepoprawny błąd w słowie sobota. Tak więc można określić, że wynik poprawy to 4/7 = 57%.

Wyniki wskazują, że aplikacje służące poprawie tekstu dla języka polskiego działają nieco gorzej niż aplikacje służące korekcie tekstu dla języka angielskiego. Powodów takiego działania może być kilka. Jak zostało przedstawione wcześniej, język polski jest mniej powszechny niż język angielski. Dodatkowo uważa się, że język polski jest jednym z najtrudniejszych języków na świecie. UNESCO szacuje, że nawet 77 proc. Polaków ma problem ze zrozumieniem czytanego po polsku tekstu. Dużą trudność może sprawiać odmiana rzeczowników oraz deklinacja. Problematyczna jest też odmiana czasowników przez osoby czy wyrażanie czasu przeszłego, teraźniejszego i przyszłego. Nade wszystko trudne są zaimki i przyimki, zwłaszcza gdy osoba, która uczy się języka polskiego w swoim rodzimym języku, nie odmienia słów, a jedynie dodaje końcówkę, czy też nie używa odmian przez osoby. W języku polskim występuje też dużo synonimów, czyli wyrazów bliskoznacznych, ale również siostrzanych słów, które mimo że brzmią tak samo i zapisywane są tak samo, to w różnym kontekście mają różne znaczenie, np. komórka -telefon albo miejsce do przechowywania przedmiotów w domu [99].

Skonstruowany Graf Przyzwyczajeń Lingwistycznych wraz z metodami kontekstowej korekty tekstu, jak wykazano, jest w stanie działać efektywnie dla kilku języków. Zmiana języka nie wpływa znacząco na sposób konstrukcji grafu, czy też na opracowane metody. Są to duże zalety stosowania takiego rozwiązania do korekty tekstów.

W dokumencie Index of /rozprawy2/11645 (Stron 118-123)