• Nie Znaleziono Wyników

Wyszukiwanie internetowe

N/A
N/A
Protected

Academic year: 2021

Share "Wyszukiwanie internetowe"

Copied!
20
0
0

Pełen tekst

(1)

Wyszukiwanie internetowe

Dr Agnieszka Nowak-Brzezioska

(2)

Tagi HTML

-czyli poprawny opis stronyWWW -(Informacje nagłówkowe,

Informacje opisujące dokument, Tytuł strony, Tagi właczające dodatkowe

pliki do dokumentu, Style, Skrypty)

(3)

Wyszukiwarki: wszystko co o nich powinniśmy wiedzied:

•Polski rynek wyszukiwarek, udział wyszukiwarek w

rynku,

Jak działaja wyszukiwarki? (4 elementy wyszukiwarki: pajaczek,

indeks, baza danych, program wyszukujacy), Co czytaja pajaczki?,

Link

Popularity,

Jak tworzony jest ranking?

(4)

Metody wyszukiwania informacji:

• wyszukiwanie boolowskie (omówienie podstawowych operacji + analiza

wyników dla Google i innej wyszukiwarki)

•wyszukiwanie wg frazy,

• wyszukiwanie strukturalne (V SM - Vector Space Model),

•webring

•oraz wyszukiwanie wg słów kluczowych,

•Wyszukiwanie rozmyte

(5)

1 google.com 86.0% 86.0% 85.3%

2 onet.pl 6.1% 5.8% 6.0%

3 wp.pl 4.5% 4.0% 4.8%

4 msn.com 0.9% 1.0% 1.4%

5 interia.pl 0.9% 1.2% 1.0%

6 szukacz.pl 0.6% 0.7% 0.5%

7 yahoo.com 0.4% 0.3% 0.3%

(6)

Historia Google + statystyki

(7)

PageRank - założenia

Działanie

● Wyobraźmy sobie internautę klikającego losowo w odnośniki w nieskończoność

● Internauta zaczyna z losowo wybranej strony u z pewnym prawdopodobieństwem , gdzie

● Z pewnym prawdopodobieństwem internauta znajdzie się na stronie v

] [u

po

p0[u] 1 ] u

1[v p

(8)

Wyszukiwanie w Google: advanced operators reference, Google Calculator

Składnia specjalna daje nam możliwośd lepszego wyszukiwania po elementach stron:

Intitle:, allintitle:, inurl:,allinurl: ,intext

inanchor: ,site: ,link:,daterange:, filetype: ,related: , info: ,phonebook: ,

zawężenie do Google grups:

Author:group:insubject Location:

source

(9)

Google Labs

Google Video (http://video.google.pl/) Froggle

Page Creator Google Reader Google Toolbar Google Desktop Google Maps

Google Mars Gmail

Kalendarz Google GDrive – dysk online Google Analytics

Google Alerts -Połączone z serwisem Google News, Picasa to menedżer plików graficznych

Google Earth Google Code SketchUp

(10)

Google API

API (Application Programming Interface) – oznacza możliwośd programowego dostępu do określonych aplikacji.

Wiosną 2002 r. Google wprowadziło Google Web API (http://api.google.com/)

Pozwoliło to użytkownikom wykorzystad wyniki wyszukiwania Google wg swoich potrzeb.

Należy jednak zaznaczyd, że Google Web API nie pozwala na wykonywanie wszystkich zapytao (np. phonebook).

(11)

Data Mining - wprowadzenie do metod eksploracji wiedzy

• odkrywanie asocjacji (associations) znajdowanie reguł typu:

piwo -> orzeszki

• wzorce sekwencji (sequential patterns) znajdowanie sekwencji dot. np. zakupów klienta:

(TV, video, kamera)

• klasyfikacja (classifications) klasyfikacja danych do grup ze względu na atrybut

decyzyjny, np.: klasyfikacja klientów przez bank do grup: dad kredyt / nie dad kredytu

• analiza skupień (clustering) grupowanie danych na wcześniej nieznae klasy, znajdowanie wspólnych cech, np.:

wyodrębnienie różnych rodzajów klientów – różnych taryf – przez sied telefonii komórkowej

(12)

Na czym polega grupowanie ?

Obiekt jest przydzielony do skupienia, którego środek ciężkości leży najbliżej w sensie odległości euklidesowej.

(13)

Carrot2 a Google

(14)
(15)

Samoorganizujące się mapy dokumentów SOM

SOM i WebSOM

(16)

Reguły asocjacyjne - sklepy internetowe - analiza koszykowa

(17)
(18)

personalizacja stron WWW - Web Mining

iGoogle

(19)

Text Mining a inteligentne wyszukiwarki internetowe (hakia, start, answerBus)

(20)

Bibliografia

http://project.carrot2.org/publications.html - publikacje odnośnie samego systemu, zaimplementowanych w nim algorytmach, clusteringu itp.

Cytaty

Powiązane dokumenty

Zanim wypróbujesz komendy dla Asystenta Google, upewnij się, że asystent głosowy jest włączony.. Nie musisz go instalować - wystarczy, że Twój smartfon obsługuje usługi Google

W trybie desktopowym wystarczy kliknąć w pożądanym miejscu na Mapach Google prawym przyciskiem myszy, a następnie wybrać opcję "Wskazówki dojazdu do.

W przypadku korzy- stania z serwisu Google Scholar za pomocą kompute- ra należącego do komputerowej sieci uniwersyteckiej, której katalog biblioteczny jest dostępny w Internecie

odwiedzin danej strony (na przykład deltami.edu.pl) stabilizowała się na pewnej granicznej wartości, to byłoby rozsądnie uznać tę wartość za miarę ważności tej strony – im

(np. ile można maks. Zadad pytao, czy jest jakieś ograniczenie co do liczby zwróconych przez Google wyników, albo czy są jakieś słowa kluczowe których nie można użyd w

• Utworzona przez nas mapa domyślnie wyświetla się w trybie zwykłym.. API oferuje dodatkowo jeszcze trzy: mapę satelitarną, mapę hybrydową oraz mapę

Pobierz stock_pictures.zip (zlokalizowany w rozpakowanym wcześniej folderze) na dysk twardy, wypakuj zawartość do folderu a następnie prześlij na dysk Google cały folder (do

Wyśrodkuj tekst, użyj czcionki Times New Roman, rozmiar 14, pogrubiona.. Nagłówek powinien być ustawiony jako inny dla pierwszej