• Nie Znaleziono Wyników

Przeglądanie zdygitalizowanych fiszek (na przykładzie Repozytorium Cyfrowego Instytutów Naukowych)

N/A
N/A
Protected

Academic year: 2021

Share "Przeglądanie zdygitalizowanych fiszek (na przykładzie Repozytorium Cyfrowego Instytutów Naukowych)"

Copied!
27
0
0

Pełen tekst

(1)

.

... .

.

.

Przeglądanie zdygitalizowanych fiszek (na przykładzie

Repozytorium Cyfrowego Instytutów Naukowych)

Janusz S. Bień

Katedra Lingwistyki Formalnej Wydział Neofilologii Uniwersytet Warszawski

i3: Internet – Infrastruktury – Innowacje Wszechobecny Internet, Poznań,16-17 kwietnia 2013

Polskie Biblioteki Cyfrowe — E-humanistyka

(2)

Projekt „Narzędzia dygitalizacji tekstów …”

Grant MNiSzW, 13.05.2009 - 12.05.2012, 118 700 zł

.Narzędzia dygitalizacji tekstów na potrzeby badań filologicznych .

.

... .

.

.

https://bitbucket.org/jsbien/ndt Wynikowe oprogramowanie dostępne bezpłatnie na zasadach licencjiGNU GPL.

.GNU General Public License .

.

... .

.

.

wolność uruchamiania programu w dowolnym celu (wolność 0) wolnośćanalizowania, jak program działa i

dostosowywania go do swoich potrzeb(wolność 1)

wolność rozpowszechniania niezmodyfikowanej kopii programu (wolność 2) wolnośćudoskonalania programu ipublicznego rozpowszechniania własnych ulepszeń, dzięki czemu może z nich skorzystać cała społeczność (wolność 3).

http://bc.klf.uw.edu.pl/330/ 2/21

(3)

Projekt „Narzędzia dygitalizacji tekstów …”

Wspomaganie skanowania (Jakub Wilk)

.scanhelper .

.

... .

.

.

https://bitbucket.org/jwilk/scanhelper obsługa skanera za pomocą SANE (Fujitsu fi-6130) wyniki: pliki graficzne PNG i opcjonalnie metadane XMP .scans2djvu+hocr

.

. .

didjvu (https://bitbucket.org/jwilk/didjvu) Konwersja na DjVu z separacją warstw:

http://gamera.sourceforge.net/doc/html/

binarization.html.

ocrodjvu (https://bitbucket.org/jwilk/ocrodjvu) OCR, m.in. tesseract

(4)

Przeglądanie zdygitalizowanych fiszek Projekt „Narzędzia dygitalizacji tekstów …”

Przegląrka materiałów leksykograficznych „Maleks”

.Projekt i testowanie .

..

.. .

. .Janusz S. Bień

.Realizacja .

.

... .

. .Tomasz Olejniczak

.Dokumentacja .

..

.. .

. .Joanna Bilińska

.Wdrożenie na potrzeby pokazu (po zakończeniu projektu) .

.

... .

.

.

Janusz S. Bień, Tomasz Olejniczak, Michał Rudolf

konsultacja: Marcin Werla, Tomasz Parkoła

http://bc.klf.uw.edu.pl/330/ 4/21

(5)

Projekt „Narzędzia dygitalizacji tekstów …”

Przegląrka materiałów leksykograficznych „Maleks”

.Projekt i testowanie .

..

.. .

. .Janusz S. Bień

.Realizacja .

.

... .

. .Tomasz Olejniczak

.Dokumentacja .

..

.. .

. .Joanna Bilińska

.Wdrożenie na potrzeby pokazu (po zakończeniu projektu) .

. .

. Janusz S. Bień, Tomasz Olejniczak, Michał Rudolf

konsultacja: Marcin Werla, Tomasz Parkoła

(6)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Projekt i jego zasoby

Podstawowe informacje o projekcie (2010-2014)

http://rcin.org.pl/dlibra/text?id=aboutRCIN

http://bc.klf.uw.edu.pl/330/ 5/21

(7)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Projekt i jego zasoby

Przykładowe kartoteki

.Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku .

.

... .

. .http://www.rcin.org.pl/publication/20029

.Kartoteka Słownika polszczyzny XVI w. (literackie nazwy własne dotyczące Polski i Europy w XVI-wiecznych publikacjach) .

.

... .

.

.http://www.rcin.org.pl/publication/23662 .Kartoteka Słownika Łaciny Średniowiecznej

. .

... .

. .http://www.rcin.org.pl/publication/31986

(8)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Pudełka z fiszkami (prawie 3 miliony fiszek)

http://bc.klf.uw.edu.pl/330/ 7/21

(9)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Fiszki zdygitalizowane (ponad 600 dokumentów)

(10)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Kolejność „pudełek”

http://bc.klf.uw.edu.pl/330/ 9/21

(11)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Opisy pudełek

(12)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Zasady dostępu

http://bc.klf.uw.edu.pl/330/ 11/21

(13)

Projekt „Repozytorium Cyfrowe Instytutów Naukowych”

Kartoteka Słownika języka polskiego XVII i 1. połowy XVIII wieku

Dostępność fiszek — przykład problemu

(14)

Przeglądarka materiałów leksykograficznych Program

Materiały leksykograficzne

.Porządek leksykograficzny (pojęcie matematyczne) .

.

... .

. .Przykład: porządekalfabetyczny

.Przeglądarka — program „maleks” (klient MySQL) .

.

... .

.

.

Dokumenty jednostronicowe (np. fiszki) w formacie DjVu („rozdzielone”, unbundled) ewentualnie uzupełnione o hOCR,

uporządkowane alfabetycznie według wyrażeń hasłowych ale dopuszczalne wyjątki

(pomyłki, zmiana koncepcji hasłowania).

http://bc.klf.uw.edu.pl/330/ 13/21

(15)

Przeglądarka materiałów leksykograficznych Program

Program „Maleks”

.Prezentacje .

.

... .

.

.

http://bc.klf.uw.edu.pl/328/

http://bc.klf.uw.edu.pl/230/

http://bc.klf.uw.edu.pl/326/

http://bc.klf.uw.edu.pl/295/

.Zapis testów i pokazów (screencasts, screenshots) .

.

... .

. .http://fleksem.klf.uw.edu.pl/ndt/maleks/

.Demonstracyjna maszyna wirtualna .

. .

. http:

//fleksem.klf.uw.edu.pl/ndt/wheezy4maleks/

(16)

Przeglądarka materiałów leksykograficznych Przykład

Wstępnie zaindeksowane fiszki

http://bc.klf.uw.edu.pl/330/ 15/21

(17)

Przeglądarka materiałów leksykograficznych Przykład

Kwerenda

(18)

Przeglądarka materiałów leksykograficznych Przykład

Rozpoczęcie wyszukiwania binarnego

http://bc.klf.uw.edu.pl/330/ 17/21

(19)

Przeglądarka materiałów leksykograficznych Przykład

Indeksowanie okazjonalne

(20)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version): Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

http://bc.klf.uw.edu.pl/330/ 19/21

(21)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version): Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

(22)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version):

Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

http://bc.klf.uw.edu.pl/330/ 19/21

(23)

Uwagi końcowe

Prawne aspekty projektu RCIN

.Głęboka analiza … .

.

... .

.

.

http://rcin.org.pl/dlibra/text?id=copywright-low Przygotowaniekażdegoobiektu wiążę się zgłęboką analiząjego stanu prawnego …

.Przykładowy plik readme.txt .

.

... .

.

.

Właściciel oryginału(owner of the original version):

Domena Publiczna; Public Domain

W kwestii dalszego wykorzystania pobranej publikacji należy kontaktować się zwłaścicielem jej oryginału.

(24)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

http://bc.klf.uw.edu.pl/330/ 20/21

(25)

Przeglądanie zdygitalizowanych fiszek Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

(26)

Uwagi końcowe

Prawne aspekty projektu RCIN

http://rcin.org.pl/dlibra/text?id=copywright-low

[…] Kopia dzieła może być wykonana wyłącznie na własny użytek oraz dla celów edukacyjnych lub badawczych z powołaniem się na źródło, z którego została zrobiona.[…]

http://bc.klf.uw.edu.pl/330/ 20/21

(27)

Uwagi końcowe

Kontakt

jsbien@uw.edu.pl jsbien@mimuw.edu.pl

nmpt-ann@mimuw.edu.pl

http://lists.mimuw.edu.pl/listinfo/nmpt-ann nmpt-l@mimuw.edu.pl

http://lists.mimuw.edu.pl/listinfo/nmpt-l

Cytaty

Powiązane dokumenty

akademickich oraz zwiększa krąg odbiorców treści naukowych... Dziękujemy

23 Ustawy o ochronie zwierząt wykorzystywanych do celów naukowych lub edukacyjnych przy uwzględnieniu przepisów Ustawy o zawo- dzie lekarza weterynarii i izbach

Wizualizacja wykonana z plaży Słowińskiego PN dla60 turbin MFW BSII, MFW Baltica 2, MFW Baltica 3 oraz MFW BSIII (scenariusz I, etap I) – ustawienie turbin bokiem do obserwatora.

- 3) Badani " na prowadionych lekcjach nie przywiązują należytej wagi do systematy- cznej kontroli i oceny realizacji celów edukacyjnych. 4) Badani nauczyciele

o wyrażeniu zgody na udostępnienie oraz wykorzystanie pracy do celów naukowych, badawczych i

Opracowana metodyka budowy i koncepcja modelu cyfrowego repozytorium zasobów nauki instytutów badawczych oraz rozpoznanie wymagań potencjalnych użytkowników w zakresie

Gabrielem, profesorem historii na uniwersytecie w Notre Dame (University of Notre Dame, Indiana, USA), oraz węgierskimi historykami żyjącymi na obczyźnie, zyskując

Obok „pakietu podstawowego” usług, czyli możliwości archiwizowania dokumentów różnego typu, upowszechniania dorobku naukowego, wzmacniania jego widoczności,