• Nie Znaleziono Wyników

Omówienie raportu o eksploracji danych badawczych

N/A
N/A
Protected

Academic year: 2021

Share "Omówienie raportu o eksploracji danych badawczych"

Copied!
2
0
0

Pełen tekst

(1)

Biuletyn EBIB, nr 7 (177)/2017, Surowe dane badawcze

Recenzje

Bożena Bednarek-Michalska Stowarzyszenie EBIB

bozena.michalska@ebib.pl

Omówienie raportu o eksploracji danych badawczych

Słowa kluczowe: dane badawcze, zbiory danych, analizy zbiorów danych, projekt Future TDM, Centrum Cy-frowe, Fundacja Projekt

Na początku lipca 2017 r. ukazał się w Centrum Cyfrowym raport Jana Strycharza zatytu-łowany Ekonomika eksploracji tekstu i danych – analiza aktualnych trendów i przyszłych

zastosowań. Centrum Cyfrowe jest członkiem konsorcjum realizującego projekt „Future

TDM”. Jak zapisano na stronach Centrum: Celem projektu realizowanego przez

między-narodowego konsorcjum, którego częścią jest Centrum Cyfrowe, jest zidentyfikowanie przeszkód (na poziomie prawnym, politycznym i organizacyjnym), stojących na drodze wy-korzystania pełnego potencjału, jaki daje TDM. Efektem tych analiz będzie opracowanie rekomendacji na poziomie europejskim. Dodatkowo, projekt przyczyni się do popularyzacji samej koncepcji eksploracji danych oraz zaangażowania zróżnicowanego środowiska in-teresariuszy. Centrum Cyfrowe odpowiedzialne będzie w szczególności za analizy otocze-nia prawnego oraz opracowanie raportu dotyczącego potencjału ekonomicznego możli-wych przyszłych sposobów wykorzystania TDM1.

Członkami konsorcjum realizującego projekt „Future TDM” są: Synyo GmbH (koordynator);

Sticht-ing Liber; Open Knowledge Foundation; StichtSticht-ing Katholieke Universiteit; The British Library Board; Universiteit van Amsterdam; Athena Research and Innovation Center in Information,

Com-munication & Knowledge Technologies; Ubiquity Press Ltd.; Centrum Cyfrowe Projekt: Polska.

Il. 1. Strona internetowa projektu Futre TDM. Źródło: http://project.futuretdm.eu/.

1Eksploracja danych (TDM). W: Centrum Cyfrowe [online]. 2017 [Dostęp 20.10.2017]. Dostępny w:

https://centrumcyfrowe.pl/projekty/future-tdm/.

(2)

Biuletyn EBIB, nr 7 (177)/2017, Surowe dane badawcze

Recenzje

Autor w bardzo przystępny sposób wyjaśnia, co oznacza pojęcie big data oraz czym jest

text and data mining (TDM) (eksploracja tekstu i danych), jak firmy prywatne wykorzystują

technologie TDM, jak dane będą wykorzystywane w przyszłości, jaki ma to wpływ na go-spodarkę europejską i światową. Nastawienie ekonomiczne nie wyklucza szerszego spoj-rzenia na wykorzystanie wielkich zbiorów danych, zapoznania się z nowymi zjawiskami i terminami, dlatego uważam, że lektura tego raportu może być przydatna dla bibliotekarzy akademickich. Jeśli spojrzymy na członków konsorcjum, to zauważymy wśród nich jedną z najważniejszych bibliotek świata – The British Library oraz stowarzyszenie LIBER. Ozna-cza to, że zagadnienie zbioru wielkich danych leży w obszarze zainteresowań biblioteka-rzy.

Zachęcamy do lektury tego raportu, a przynajmniej niektórych jego części, które mogą być przydatne w pracy bibliotekarza. Spis treści przedstawia się następująco:

1. Eksploracja tekstu i danych jako aktywa gospodarcze

1.1. Od danych do wartości – podstawowe definicje Big Data i TDM

1.2. Pogłębiona charakterystyka Text i Data Miningu i konotacja biznesowa 2. Perspektywa i doświadczenie firm

2.1. Praktyki i bariery

2.2. Zróżnicowanie branżowe i źródła danych

2.3. Konkluzja – ludzkie talenty analityczne niezbędnym składnikiem konwersji Big Data na wartość gospodarczą

3. Rynkowa i gospodarcza wartość Big Data i TDM 3.1. Szacunki globalne i europejskie

3.2. Szerszy wpływ danych na gospodarkę.

Raport jest dostępny w wersji polskiej i angielskiej na stronach Centrum Cyfrowego: https://centrumcyfrowe.pl/czytelnia/ekonomika-eksploracji-tekstu-i-danych-analiza-aktual - nych-trendow-i-przyszlych-zastosowan/.

BEDNAREK-MICHALSKA, B. Omówienie raportu o eksploracji danych badawczych. Biuletyn EBIB [online] 2017, nr 7 (177), Surowe dane badawcze. [Dostęp 21.12.2017]. Dostępny w:

http://open.ebib.pl/ojs/index.php/ebib/article/view/572. ISSN 1507-7187.

Cytaty

Powiązane dokumenty

Projekcje parametrów na płaszczyzny zdefiniowane przez pierwszy (PC1) i drugi czynnik (PC2) główny ujawniły, że próbki można pogrupować na podstawie zawartości kwasu

Na pierwszej stronie sprawozdania MUSZĄ być podane następujące informacje: imię, nazwisko i numer indeksu autora (lub autorów) oraz przynależność do

Osoby fizyczne Nazwiska i imiona, imona rodziców, data urodzenia, miejsce urodzenia , adres zamieszkania lub pobytu, numer ewidencyjny PESEL, NIP, REGON, numer telefonu, adres

nazwiska i imiona, imiona rodziców, data urodzenia, miejsce urodzenia, adres zamieszkania lub pobytu, numer ewidencyjny PESEL, miejsce pracy, zawód, wykształcenie, seria i numer

Zajęcia nr 2 Przegląd zbiorów danych z 2 źródeł: MLRepository oraz ArrayExpress Wybór po jednym przykładowym zbiorze do późniejszych analiz z obu zbiorów. Zajęcia nr

W następnych punktach tego rozdziału opisano szczegółowo etapy procesu realizacji projektu według rozszerzonej me- todyki CRISP-DM, uwzględniającej specyfikę procesów analizy

 Zintegrowane uczenie – integracja fazy przetwarzania danych z fazą uczenia (indukcji klasyfikatora).. Redukcja atrybutów. 

Należy zwrócić uwagę na wskazanie pliku AFINN-111.txt, plik ten został wybrany z repozytorium (po zleceniu zadania zostanie pobrany z repozytorium i przeniesiony na