Poniższa dysertacja stawia oraz dowodzi tezy. iż miara zbieżności tematycznej użyta jako surogat miary pełności (recall) w przeszukiwaniu on-line sieci WWW jest zależna od przyjętej strategii crawlingu oraz, że zastosowanie w strategiach crawlingu aparatu semantycznego, oceniającego zgodność tekstu i zapytania w każdym przypadku przynosi poprawę zbieżności tematycznej crawlingu zorientowanego na zapytanie. W celu wykazania tez przedstawiono zagadnienie crawlingu zorientowanego na zapytanie, miary oceny jakości takiego crawlingu oraz klasyczne strategie crawlingowe. Następnie przedstawiono aparat semantyczny i zaproponowano strategie crawl ingowe używające informacji semantycznej o przetwarzanych tekstach. Słuszność tez wykazano na podstawie wyników miary zbieżności tematycznej w przeprowadzonych eksperymentach na zróżnicowanych korpusach i zapytaniach.
The dissertation proves the thesis, that harvest-ratio measure used as the recall surrogate in online focused crawling depends on a crawling strategy and that use of semantic information in crawling strategies brings better harvest ratio in focused crawling. Thesis describes a domain of focused crawling, a problem of measures in this kind of crawlers and description of standard crawling strategies. To present new kind of strategies semantic methods were introduced and applied. Theses were proved by results of several experiments on different topics and corpora using harvest-ratio measure for evaluation.