• Nie Znaleziono Wyników

Przetwarzanie tekstu metodami eksploracji danych Prof. dr hab.

N/A
N/A
Protected

Academic year: 2021

Share "Przetwarzanie tekstu metodami eksploracji danych Prof. dr hab."

Copied!
1
0
0

Pełen tekst

(1)

Przetwarzanie tekstu metodami eksploracji danych

Prof. dr hab. Henryk Rybiński,

Instytut Informatyki Politechniki Warszawskiej Zakład Systemów Informacyjnych

Streszczenie

Celem wykładu jest przegląd zagadnień związanych z przetwarzaniem danych tekstowych metodami eksploracji danych. W pierwszej kolejności zaprezentowana zostanie dziedzina eksploracji danych tekstowych. Przedstawione zostaną podstawowe pojęcia tej dziedziny, następnie omówione będą podstawowe kierunki badań. Będą też zaprezentowane przykłady zastosowań.

W badaniach odkrywania wiedzy z danych tekstowych wyróżnia się podejścia knowledge-rich i knowledge-poor. Podejście knowledge-rich w wielu przypadkach pozwala uzyskiwać dobre wyniki, jednak podstawową jego wadą jest to, że wymaga ono zewnętrznych bazy wiedzy.

Natomiast podejście odkrywanie wiedzy z danych tekstowych metodami eksploracji danych charakteryzuje się tym, że zwykle jest to podejście typu knowledge-poor. Zaprezentowane zostaną badania własne bazujące w dużej mierze na podejściu knowledge-poor. W szczególności pokazane będą podejścia do odkrywania znaczeń słów w oparciu o metodę zbiorów zamkniętych (SnS). Przedyskutowana zostanie możliwość wykorzystania tej metody w procesie grupowania semantycznego krótkich tekstów. Ponadto będzie pokazany algorytm wspomagania procesu budowania słowników dwujęzycznych, w którym także możliwe jest wykorzystanie algorytmu SnS do wykrywania tłumaczeń terminów wielojęzycznych.

Na zakończenie pokazane zostaną metody przetwarzania tekstu na potrzeby zrealizowanego w Instytucie Informatyki systemu bazy wiedzy. Przedstawione będą algorytmy wzbogacania semantycznego tekstów naukowych oraz metody wyszukiwania (i rankingu) ekspertów.

Cytaty

Powiązane dokumenty

• korelacja dodatnia (wartość współczynnika korelacji od 0 do 1) –informuje, że wzrostowi wartości jednej cechy towarzyszy wzrost średnich wartości drugiej

W kroku drugim, na podstawie znalezionych zbiorów częstych są generowane wszystkie reguły asocjacyjne, których ufność jest większa niż zadany próg ufności minconf..

Zajęcia nr 2 Przegląd zbiorów danych z 2 źródeł: MLRepository oraz ArrayExpress Wybór po jednym przykładowym zbiorze do późniejszych analiz z obu zbiorów. Zajęcia nr

Dla danych z zadania 3 znormalizuj metodą min-max dane z kolumny 3, tak by zamiast zakresu 50- 200 dane miały zakres 0-10. Narzędzie: dowolne: R albo Excel,

W następnych punktach tego rozdziału opisano szczegółowo etapy procesu realizacji projektu według rozszerzonej me- todyki CRISP-DM, uwzględniającej specyfikę procesów analizy

STRUKTURY ASOCJACYJNE ORAZ ASOCJACYJNE GRAFY NEURONOWE DO EKSPLORACJI WIEDZY Z DANYCH?.

 Zintegrowane uczenie – integracja fazy przetwarzania danych z fazą uczenia (indukcji klasyfikatora).. Redukcja atrybutów. 

ujęty został katalog kar dodatkowych, który obej- mował następujące kary: utratę praw publicznych, utratę obywatelskich praw honorowych, utratę prawa wykonywania zawodu, utratę