• Nie Znaleziono Wyników

Przeglądanie zdygitalizowanych fiszek (na przykładzie Repozytorium Cyfrowego Instytutów Naukowych)

N/A
N/A
Protected

Academic year: 2021

Share "Przeglądanie zdygitalizowanych fiszek (na przykładzie Repozytorium Cyfrowego Instytutów Naukowych)"

Copied!
27
0
0

Pełen tekst

(1)

.

... .

.

.

Przeglądanie zdygitalizowanych fiszek (na przykładzie

Repozytorium Cyfrowego Instytutów Naukowych)

Janusz S. Bień

Katedra Lingwistyki Formalnej Wydział Neofilologii Uniwersytet Warszawski

i3: Internet – Infrastruktury – Innowacje Wszechobecny Internet, Poznań,16-17 kwietnia 2013

Polskie Biblioteki Cyfrowe — E-humanistyka

(2)

Projekt „Narzędzia dygitalizacji tekstów …”

Grant MNiSzW, 13.05.2009 - 12.05.2012, 118 700 zł

.Narzędzia dygitalizacji tekstów na potrzeby badań filologicznych .

.

... .

.

.

https://bitbucket.org/jsbien/ndt Wynikowe oprogramowanie dostępne bezpłatnie na zasadach licencjiGNU GPL.

.GNU General Public License .

.

... .

.

.

wolność uruchamiania programu w dowolnym celu (wolność 0) wolnośćanalizowania, jak program działa i

dostosowywania go do swoich potrzeb(wolność 1)

wolność rozpowszechniania niezmodyfikowanej kopii programu (wolność 2) wolnośćudoskonalania programu ipublicznego rozpowszechniania własnych ulepszeń, dzięki czemu może z nich skorzystać cała społeczność (wolność 3).

http://bc.klf.uw.edu.pl/330/ 2/21

(3)

Projekt „Narzędzia dygitalizacji tekstów …”

Wspomaganie skanowania (Jakub Wilk)

.scanhelper .

.

... .

.

.

https://bitbucket.org/jwilk/scanhelper obsługa skanera za pomocą SANE (Fujitsu fi-6130) wyniki: pliki graficzne PNG i opcjonalnie metadane XMP .scans2djvu+hocr

.

. .

didjvu (https://bitbucket.org/jwilk/didjvu) Konwersja na DjVu z separacją warstw:

http://gamera.sourceforge.net/doc/html/

binarization.html.

ocrodjvu (https://bitbucket.org/jwilk/ocrodjvu) OCR, m.in. tesseract

(4)

Przeglądanie zdygitalizowanych fiszek Projekt „Narzędzia dygitalizacji tekstów …”

Przegląrka materiałów leksykograficznych „Maleks”

.Projekt i testowanie .

..

.. .

. .Janusz S. Bień

.Realizacja .

.

... .

. .Tomasz Olejniczak

.Dokumentacja .

..

.. .

. .Joanna Bilińska

.Wdrożenie na potrzeby pokazu (po zakończeniu projektu) .

.

... .

.

.

Janusz S. Bień, Tomasz Olejniczak, Michał Rudolf

konsultacja: Marcin Werla, Tomasz Parkoła

http://bc.klf.uw.edu.pl/330/ 4/21

(5)

Projekt „Narzędzia dygitalizacji tekstów …”

Przegląrka materiałów leksykograficznych „Maleks”

.Projekt i testowanie .

..

.. .

. .Janusz S. Bień

.Realizacja .

.

... .

. .Tomasz Olejniczak

.Dokumentacja .

..

.. .

. .Joanna Bilińska

.Wdrożenie na potrzeby pokazu (po zakończeniu projektu) .

. .

. Janusz S. Bień, Tomasz Olejniczak, Michał Rudolf

konsultacja: Marcin Werla, Tomasz Parkoła

(6)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Projekt i jego zasoby

Podstawowe informacje o projekcie (2010-2014)

http://rcin.org.pl/dlibra/text?id=aboutRCIN

http://bc.klf.uw.edu.pl/330/ 5/21

(7)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Projekt i jego zasoby

Przykładowe kartoteki

.Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku .

.

... .

. .http://www.rcin.org.pl/publication/20029

.Kartoteka Słownika polszczyzny XVI w. (literackie nazwy własne dotyczące Polski i Europy w XVI-wiecznych publikacjach) .

.

... .

.

.http://www.rcin.org.pl/publication/23662 .Kartoteka Słownika Łaciny Średniowiecznej

. .

... .

. .http://www.rcin.org.pl/publication/31986

(8)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Pudełka z fiszkami (prawie 3 miliony fiszek)

http://bc.klf.uw.edu.pl/330/ 7/21

(9)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Fiszki zdygitalizowane (ponad 600 dokumentów)

(10)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Kolejność „pudełek”

http://bc.klf.uw.edu.pl/330/ 9/21

(11)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Opisy pudełek

(12)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Zasady dostępu

http://bc.klf.uw.edu.pl/330/ 11/21

(13)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Dostępność fiszek — przykład problemu

(14)

Przeglądarka materiałów leksykograficznych Program

Materiały leksykograficzne

.Porządek leksykograficzny (pojęcie matematyczne) .

.

... .

. .Przykład: porządekalfabetyczny

.Przeglądarka — program „maleks” (klient MySQL) .

.

... .

.

.

Dokumenty jednostronicowe (np. fiszki) w formacie DjVu („rozdzielone”, unbundled) ewentualnie uzupełnione o hOCR,

uporządkowane alfabetycznie według wyrażeń hasłowych ale dopuszczalne wyjątki

(pomyłki, zmiana koncepcji hasłowania).

http://bc.klf.uw.edu.pl/330/ 13/21

(15)

Przeglądarka materiałów leksykograficznych Program

Program „Maleks”

.Prezentacje .

.

... .

.

.

http://bc.klf.uw.edu.pl/328/

http://bc.klf.uw.edu.pl/230/

http://bc.klf.uw.edu.pl/326/

http://bc.klf.uw.edu.pl/295/

.Zapis testów i pokazów (screencasts, screenshots) .

.

... .

. .http://fleksem.klf.uw.edu.pl/ndt/maleks/

.Demonstracyjna maszyna wirtualna .

. .

. http:

//fleksem.klf.uw.edu.pl/ndt/wheezy4maleks/

(16)

Przeglądarka materiałów leksykograficznych Przykład

Wstępnie zaindeksowane fiszki

http://bc.klf.uw.edu.pl/330/ 15/21

(17)

Przeglądarka materiałów leksykograficznych Przykład

Kwerenda

(18)

Przeglądarka materiałów leksykograficznych Przykład

Rozpoczęcie wyszukiwania binarnego

http://bc.klf.uw.edu.pl/330/ 17/21

(19)

Przeglądarka materiałów leksykograficznych Przykład

Indeksowanie okazjonalne

(20)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version): Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

http://bc.klf.uw.edu.pl/330/ 19/21

(21)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version): Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

(22)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version):

Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

http://bc.klf.uw.edu.pl/330/ 19/21

(23)

Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version):

Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

(24)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

http://bc.klf.uw.edu.pl/330/ 20/21

(25)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

(26)

Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

http://bc.klf.uw.edu.pl/330/ 20/21

(27)

Uwagi końcowe

Kontakt

jsbien@uw.edu.pl jsbien@mimuw.edu.pl

nmpt-ann@mimuw.edu.pl

http://lists.mimuw.edu.pl/listinfo/nmpt-ann nmpt-l@mimuw.edu.pl

http://lists.mimuw.edu.pl/listinfo/nmpt-l

Cytaty

Powiązane dokumenty

23 Ustawy o ochronie zwierząt wykorzystywanych do celów naukowych lub edukacyjnych przy uwzględnieniu przepisów Ustawy o zawo- dzie lekarza weterynarii i izbach

Obok „pakietu podstawowego” usług, czyli możliwości archiwizowania dokumentów różnego typu, upowszechniania dorobku naukowego, wzmacniania jego widoczności,

o wyrażeniu zgody na udostępnienie oraz wykorzystanie pracy do celów naukowych, badawczych i

Opracowana metodyka budowy i koncepcja modelu cyfrowego repozytorium zasobów nauki instytutów badawczych oraz rozpoznanie wymagań potencjalnych użytkowników w zakresie

Gabrielem, profesorem historii na uniwersytecie w Notre Dame (University of Notre Dame, Indiana, USA), oraz węgierskimi historykami żyjącymi na obczyźnie, zyskując

- 3) Badani " na prowadionych lekcjach nie przywiązują należytej wagi do systematy- cznej kontroli i oceny realizacji celów edukacyjnych. 4) Badani nauczyciele

Wizualizacja wykonana z plaży Słowińskiego PN dla60 turbin MFW BSII, MFW Baltica 2, MFW Baltica 3 oraz MFW BSIII (scenariusz I, etap I) – ustawienie turbin bokiem do obserwatora.

akademickich oraz zwiększa krąg odbiorców treści naukowych... Dziękujemy