Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Joanna Bilińska
Uniwersytet Warszawski
V Glosa do leksykografii Warszawa, 19.09.2014 r.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Słownik języka polskiego
autor: Samuel Bogumił Linde 6 tomów
1807–1814 (pierwsze wyd.) 1854–1861 (drugie wyd.)
ogólny słownik języka polskiego
z tłumaczeniami na wiele języków i dialektów zapisywanych w wielu alfabetach
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Przykładowy prosty artykuł hasłowy
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Korpusowa dygitalizacja słownika Lindego
http://korpusy.klf.uw.edu.pl/pl/slownik-lindego/
II wydanie
słownik w pliku DjVu traktowany jako korpus wyszukiwarka korpusowa
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Języki w słowniku Lindego
ok. 92 etnolekty,
oznaczone odpowiednimi skrótami (jak dotąd zidentyfikowano 251)
etnolekty:
germańskie słowiańskie romańskie
inne: arabski, hebrajski, sanskryt, turecki, węgierski, fiński, grecki, walijski, albański. . .
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Alfabety i czcionki
alfabet łaciński ze znakami typowymi dla różnych języków, alfabet łaciński zapisany frakturą,
cyrylica (grażdanka i cyrylica cerkiewna), alfabet hebrajski lub podobny,
alfabet grecki
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Alfabet łaciński
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Alfabet podobny do hebrajskiego I
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Alfabet grecki
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Cyrylica
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Skróty
różnego pochodzenia (z łaciny, polskiego), niekonsekwentnie stosowane,
kilka skrótów dla jednego etnolektu, np.:
dla włoskiego: Ital., It., Włosk., Wło.,
dla węgierskiego: Węg., Hung., Hg., Hng., Weg., Hungar., Ungar., Ung.,
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Niekonsekwencja
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Algorytm rozpoznawania cytatów obcojęzycznych
tekst kursywą (= skrót), wielka litera na początku, kropka na końcu,
cytat obcojęzyczny (krój prosty), średnik,
kropka po bloku cytatów
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Przypadki nietypowe
1 kilka skrótów — jeden przykład
2 niejednoznaczność
Alb., Gal., Karn., Lit., Syr., Tur., Turk. — oznaczenia etnolektów oraz źródeł (z liczbą oznaczającą lokalizację)
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Etnolekty germańskie I
niemiecki — zwykle bez skrótu, ewentualnie: Germ., Ger., Niem,
staro-wysoko-niemiecki: Notker., Notker, apud Notker, ap.
Notker, apud Notkerum., apud Otfrid, Ottfr., Ottfryd., Otfried., ap. Ofryd,
dolnoniemiecki: Niederd., Infer. Germ., Germ. Infer., średnio-wysoko-niemiecki: Willeram., ap. Viller., Willer, dolnosaski: Niedersachs., Niedersächs, Nidersächs, Osnabrück,
saski: Sax.,
wysoko-niemiecki: Hochdeutsch.
szwabski: Schwab.,
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Etnolekty germańskie II
alemański: Alem., Alleman., austriacki: Austriac., Austr.,
gocki: Goth., ap. Uphil., Ulfilas, got., angielski: Angl., Angiel.,
fryzyjski: Frisland.,
niderlandzki: Holl., Hol., Holland.,
grupa skandynawska: Scand., Skand., skand., islandzki: Isl., Island.,
norweski: Norv.,
szwedzki: Sved., Svec., Suec., szwedz., duński: Dan., Dun.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Etnolekty słowiańskie I
zachodniosłowiańskie:
czeski: Bh., Boh., Cz., Czesk., czesk., staroczeski: staroczesk.,
słowacki: Slo., Slov., Slovac., Słow., morawski: Morav.,
łużycki: Sor.,
górnołużycki: Sor. 1, Sorab. sup., Surab. sup, Surab. 1, Sr. 1, dolnołużycki: Sor. 2, Sorab. inf., Sr. 2,
polski: Polon., Pol.,
staropolski: starop., staropolsk., połabski: Polab.
wschodniosłowiańskie:
rosyjski: Rs., Ross., ruski: rusk., Rusk.,
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Etnolekty słowiańskie II
rusiński: Rusn., huculski: huc.,
karpacki: karp., Karpack.
południowosłowiańskie:
cerkiewnosłowiański: Cerk., Eccl., Ec., Eccles., Kośc., Kość., chorwacki: Cro., Croa., Croat., Kro., Kroa., Kroat.,
windyjski (styryjski): Vind., Vd., Wind., kraiński (goreński): Crn., Carn., Karn., bułgarski: Bulg.,
iliryjski: Illyr., illir., ilir.,
slawoński: Sla., Slav., Slavon., Sław., bośniacki: Bs., Bosn., Bośn., Boss., Boś.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Etnolekty romańskie I
łacina: Lat., Łac., łac., Lat. med., Łac. Śrz., Łac. śrzed., Łac.
śrzedniej,
starołaciński: Vetus Ital.,
francuski: Gall., Gallis., Gal., Franc., Fran., Francogall., hiszpański: Hisp., Hiszp., Hispan.,
portugalski: Portug.,
włoski: Ital., It., Włosk., Wło., rumuński: Roman.,
raguzański: Rg., Rag., dalmacki: Dalm., Dl., Dal.,
wołoski: Wołosk., Wallach., Walach.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Inne etnolekty I
semickie:
arabski: Arab., Arabsk., syryjski: Syr.,
hebrajski: Hebr., Hbr., Rab., Rabb.,
chaldyjski: Chald., Chal. Talm., Chald. Tal., Chald. Tlmd., Tal., samarytański: Samar.,
etiopski: Aeth., Aethiop., indo-irańskie:
sanskryt: sanskr., Sanscr., sanscr., hindi: Ind.,
awestyjski (zend): zend., Zend., perski: Pers., Persic.,
staroperski: Staropers. (tylko w jednym dopisku redaktora), tureckie:
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Inne etnolekty II
turecki: Tur., Turc., Turk.,
krymski: Crim. Tatar., Tatar. Crim., Krim., Kimr., tatarski: Tatar., Tat.,
ugrofińskie:
węgierski: Węg., Hung., Hg., Hng., Weg., Hungar., Ungar., Ung.,
fiński: Finn., Finl., Finland., estoński: Esthon., Esthnic., lapoński: Lappon., Lapp., czudzki/wotski: czudz., czudzk.
helleńskie:
grecki: Greck., Gr., Graec.,
grecko-łaciński: Greckołac., greckołac., Graecolat., grecki dialekt eolski: Aeol.,
grecki dialekt dorycki: Dor.,
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Inne etnolekty III
grecki dialekt epirocki: Epirot., grecki w Tesalonikach?: Thessal., u Tacjana Syryjczyka?: Tatian, celtyckie:
walijski: Wallis., Vallis., irlandzki: Hibern., irl., Irl., bretoński: Bretag., Bretan..
bałtyckie:
litewski: Lit., Lith., Litt., Litewsk., łotewski: Lett..
staropruski: staroprusk.
albański: Alb., Alban., syberyjski?: Siber., starobułgarski: starobółg.,
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Inne etnolekty IV
meksykański?: Mexic., malajalam: Malabar., Malab., maurytyjski: Maurit.,
frygijski: fryg.,
u Kerona: ap. Keron, Kero., bagulalski?: Bagus., Kerze
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Przypadki niejasne
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Najliczniej reprezentowane etnolekty I
Skróty występujące ponad 10 000 razy dotyczą:
rosyjskiego (ok. 25 000), czeskiego,
bośniackiego,
kraińskiego (goreńskiego), chorwackiego,
cerkiewnego, windyjskiego
Po kilka tysięcy wystąpień mają skróty oznaczające:
dalmacki,
niemiecki (niezależnie od cytatów bez skrótów),
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Najliczniej reprezentowane etnolekty II
grecki, węgierski, łacinę, raguzański, slawoński, słowacki.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Rozwinięcia skrótów nazw etnolektów — tabela
http://bc.klf.uw.edu.pl/347/
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Objaśnienia do tabeli
Źródło skrótu = gdzie pojawia się po raz pierwszy:
LL — lista skrótów przygotowana przez Lindego, AH — artykuł hasłowy,
PL — „Prawidła etymologii” Lindego, errata
uzupełnienia
liczba wystąpień — szacunkowa na podstawie
http://korpusy.klf.uw.edu.pl/pl/slownik-lindego/
(jakość OCR-u)
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Bibliografia I
Samuel Bogumił Linde, Słownik języka polskiego, wyd. I, Warszawa 1807-1814.
Samuel Bogumił Linde, Słownik języka polskiego, wyd. II, Zakład Narodowy im. Ossolińskich, Lwów 1854-1860,
http://kpbc.umk.pl/publication/8173.
Samuel Bogumił Linde, Słownik języka polskiego, wyd. II, reprint, Wydawnictwo Gutenberg-Print, Warszawa 1994,
http://kpbc.umk.pl/publication/8173.
Samuel Bogumił Linde, Słownik języka polskiego, wersja zdygitalizowana z wyszukiwarką,
http://korpusy.klf.uw.edu.pl/pl/slownik-lindego/.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Bibliografia II
Joanna Bilińska, Analiza i leksykograficzny opis struktury słownika Lindego na potrzeby dygitalizacji, rozprawa doktorska, Warszawa 2013,http://bc.klf.uw.edu.pl/347/.
Joanna Bilińska, Sostavlenie perečnâ sokraščenij nazvanij âzykov v ramkah proekta digitalizacii «Slovarâ pol’skogo âzyka» S. B. Linde [w:] Informacionnye tehnologii i pismennoe nasledie.
El’Manuscript-2012. IV naučnaâ konferenciâ, Petrozavodskij gosudarstvennyj universitet, Iževskij gosudarstvennyj tehničeskij universitet, Petrozavodsk, Iżewsk 2012, s. 34-43,
http://bc.klf.uw.edu.pl/301/.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie
Bibliografia III
Joanna Bilińska, Describing Linde’s Dictionary of Polish for Digitalisation Purposes [w:] I. Kosem, K. Kosem (red.), Electronic Lexicography in the 21st Century. New Applications for New Users. Proceedings of eLex 2011, Bled, 10-12 November 2011, Bled 2011.
Bożena Matuszczyk, Słownik języka polskiego S. B. Lindego.
Warsztat leksykografa, Wydawnictwo KUL, Lublin 2006.
Tadeusz Lewaszkiewicz, Panslawistyczne osobliwości leksykalne S.
B. Lindego i jego projekt stworzenia wspólnego języka słowiańskiego, 1980.
Marian Ptaszyk, Słownik języka polskiego Samuela Bogumiła Lindego. Szkice bibliologiczne, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń 2007.
J. Bilińska Wielojęzyczność Słownika języka polskiego S.B. Lindego w oparciu o wydanie drugie