Carrot 2
Korzystając z materiałów:
http://search.carrot2.org/stable/search http://project.carrot2.org/
http://project.carrot2.org/documentation.html http://project.carrot2.org/publications.html
odpowiedz na pytania:
1. Na czym polega działanie systemu Carrot 2 ?
2. Czy można w jakiś sposób manipulowad opcjami wyszukiwania? Jeśli tak to jakimi ? 3. Co jest kryterium grupowania dokumentów ?
4. Przedstaw cechy charakterystyczne algorytmów: Lingo oraz Suffix Tree Clustering.
5. Wymieo meta wyszukiwarki które obsługuje Carrot.
6. Który z algorytmów Lingo czy STC ma krótsze charakterystyki dla tworzonych grup dokumentów ?
7. Jak liczne zbiory dokumentów mogą byd przeszukiwane w systemie Carrot dla zachowania efektywności wyszukiwania ?
8. Jaka jest rola stemmera ?
9. Czy w systemie Carrot jest możliwa modyfikacja tzw. stop list ? Co to jest stop lista ? 10. Pracuj również z narzędziem Carrot2 Document Clustering Workbench i odpowiedz na
następujące pytania:
Co powoduje zmiana minimalnego rozmiaru grupy ?
Co powoduje zmiana częstości występowania słów w dokumencie?
Mapy Samoorganizujące się
11. Na czym polega uczenie się sieci neuronowej a na czym uczenie mapy samoorganizującej ?
12. Wady map samoorganizujących się.
13. Wymieo cechy SOM.
14. Przebieg WebSOM.
15. Przedstaw różnice między topologią sieci: prostokątną, heksagonalną, łaocuchem otwartym i zamkniętym.
16. Jakie są rodzaje sąsiedztwa w zależności od topologii.
17. Cechy różnych metodyk zmian wag neuronów: WTA, WTM
Page Rank
18. Wykonaj 5 iteracji algorytmu PageRank dla sieci następujących hiperłączy:
1 2 3 4 5
Home 1.00
Page 1 1.00
Page 2 1.00
Page 3 1.00
Total PR: 4.00
PR Loss: 0