Słownik Lindego jako korpus
.
... .
.
.
Prezentacja elektronicznej wersji słownika S. B. Lindego
(słownik jako korpus)
Janusz S. Bień, Joanna Bilińska
Katedra Lingwistyki Formalnej Wydział Neofilologii Uniwersytet Warszawski
19 listopada 2012 r.
Konferencja Bibliotheca Lindiana BUW, Warszawa
http://bc.klf.uw.edu.pl/324/ 1/17
Wydania słownika
Wydania oryginalne i reprinty
.1807-1814: wydanie pierwsze . ..
.. .
.
.
.1854-1860: wydanie drugie poprawione i pomnożone . ..
.. .
.
.
.1951: wydanie trzecie fotooffsetowe .
.
... .
. .Państwowy Instytut Wydawniczy
.1994-1995: [wydanie czwarte], druk cyfrowy?, wysoka jakość .
.
... .
. .Wydawnictwo GUTENBERG-PRINT
http://bc.klf.uw.edu.pl/324/ 2/17
Słownik Lindego jako korpus Dygitalizacje słownika
Pierwsze dygitalizacje
Chronologia trudna do ustalenia
.Kujawsko-Pomorska Biblioteka Cyfrowa — 18-19 kwietnia 2006 .
.
... .
.
.
Wydanie pierwsze
Hierarchiczny opis bibliograficzny.
http://kpbc.umk.pl/publication/8173 .Polska Biblioteka Internetowa — 2005?-2008?
. .
... .
.
.
Oba wydania — początkowo niekompletne?!
Osobny opis każdego tomu — bez informacji o wydaniu!
Błędy literowe w tytule!
http://www.pbi.edu.pl
.Pierwszy mogł być Tadeusz Złotorzycki — 2006?
. .
... .
.
.
Informacja R. Antoszewskiego z 15.07.2006 r.
Skany niedostępne od 2008 r.
http://www.antoranz.net/CURIOSA/ZBIOR6/C0607/20060723- QZE00005_Linde.HTM
http://bc.klf.uw.edu.pl/324/ 3/17
Dygitalizacje słownika
Masowa dygitalizacja — „brudny OCR”
Biblioteka Bodlejańska w Oxfordzie — 1. wyd.
http://bc.klf.uw.edu.pl/324/ 4/17
Słownik Lindego jako korpus Dygitalizacje słownika
Masowa dygitalizacja — „brudny OCR”
Bawarska Biblioteka Państwowa — 2. wyd.
http://bc.klf.uw.edu.pl/324/ 5/17
Dygitalizacje słownika
Masowa dygitalizacja — „brudny OCR”
Google Books (egz. Bawarskiej Biblioteki Państwowej)
http://bc.klf.uw.edu.pl/324/ 6/17
Słownik Lindego jako korpus Dygitalizacje słownika
Katedra Lingwistyki Formalnej UW
”Narzędzia dygitalizacji tekstów na potrzeby badań filologicznych” — grant MNiSzW (2009-2012)
.Zdygitalizowane wydanie czwarte (GUTENBERG-PRINT) .
.
... .
.
.
2010 — 400 dpi, czarno-białe (oryginalnie skala szarości) Tekst w formacie DjVu, „brudny OCR” (tylko język polski):
http://poliqarp.wbl.klf.uw.edu.pl/extra/
linde/index.djvu Wyszukiwarka:
http://poliqarp.wbl.klf.uw.edu.pl/
slownik-lindego/
2011 — 600 dpi, skala szarości
Tekst w formacie DjVu, „brudny OCR” (tylko język polski):
http:
//eprints.wbl.klf.uw.edu.pl/view/creators/
Linde=3ASamuel_Bogumi==0142=3A=3A.html
http://bc.klf.uw.edu.pl/324/ 7/17
Dygitalizacje słownika
Katedra Lingwistyki Formalnej UW
„Konspekt”, „zakładki” (outline, bookmarks) słownika
http://bc.klf.uw.edu.pl/324/ 8/17
Słownik Lindego jako korpus
Inne dygitalizacje Katedry Lingwistyki Formalnej UW Indeks a tergo do słownika języka polskiego S. B. Lindego
Indeks a tergo — przykładowe strony
http://bc.klf.uw.edu.pl/324/ 9/17
Inne dygitalizacje Katedry Lingwistyki Formalnej UW Indeks a tergo do słownika języka polskiego S. B. Lindego
Konfrontacja indeksu ze słownikiem
Tekst indeksu w formacie DjVu:
http://eprints.wbl.klf.uw.edu.pl/19/
.Zauważone rozbieżności .
.
... .
.
.
:
: ( )
.Kontrowersyjne decyzje?
. .
... .
.
.: ?
.Błąd?
. .
... .
.
.
http://bc.klf.uw.edu.pl/324/ 10/17
Słownik Lindego jako korpus
Inne dygitalizacje Katedry Lingwistyki Formalnej UW
Wiadomości o autorach i dziełach cytowanych w Słowniku Lindego
Stefan Hrabec i Franciszek Pepłowski (1963)
Tekst w formacie DjVu:
http://eprints.wbl.klf.uw.edu.pl/23/
http://bc.klf.uw.edu.pl/324/ 11/17
Inne dygitalizacje Katedry Lingwistyki Formalnej UW
„Michał Samuel Bogumił Linde a leksykografia słowiańska”
Prace Filologiczne XXX (1981) część I
Tekst w formacie DjVu — adres tymczasowy:
http://eprints.wbl.klf.uw.edu.pl/76/
DlaczegoMichał???
http://bc.klf.uw.edu.pl/324/ 12/17
Słownik Lindego jako korpus
Inne dygitalizacje Katedry Lingwistyki Formalnej UW
„Michał Samuel Bogumił Linde a leksykografia słowiańska”
M.Samuel Bogumił Linde
http://bc.klf.uw.edu.pl/324/ 13/17
Wyszukiwarka KLF UW Poliqarp for DjVu
Wyszukiwarka korpusowa
http://bc.klf.uw.edu.pl/324/ 14/17
Słownik Lindego jako korpus Wyszukiwarka KLF UW
Poliqarp for DjVu
Przykład użycia
http://bc.klf.uw.edu.pl/324/ 15/17
Uwagi końcowe
Dodatkowe informacje
.Wybrane publikacje .
.
... .
.
.
Janusz S. Bień. Skanowane teksty jako korpusy.
Prace Filologiczne LXIII (2012), s. 25–36.
http://bc.klf.uw.edu.pl/201/
Joanna Bilińska, Describing Linde’s Dictionary of Polish for Digitalisation Purposes. In: Electronic lexicography in the 21st century: new applications for new users (eLEX2011),
10-12.11.2011, Bled, Slovenia, http://bc.klf.uw.edu.pl/216/
Joanna Bilińska, Составление перечня сокращенных названий языко в в рамках проекта дигитализации «Словаря польского языка» С.Б.Линде Информационные технологии и письменное наследие, El’Manuscript-12, Petrozawodsk (Rosja), 3-8 września 2012 r.,
http://bc.klf.uw.edu.pl/301/
http://bc.klf.uw.edu.pl/324/ 16/17
Słownik Lindego jako korpus Uwagi końcowe
Kontakt
jsbien@uw.edu.pl
j.bilinska@uw.edu.pl
nmpt-ann@mimuw.edu.pl
http://lists.mimuw.edu.pl/listinfo/nmpt-ann nmpt-l@mimuw.edu.pl
http://lists.mimuw.edu.pl/listinfo/nmpt-l
http://bc.klf.uw.edu.pl/324/ 17/17