• Nie Znaleziono Wyników

Wariancja. Wprowadzenie Przeczytaj Galeria zdjęć interaktywnych Sprawdź się Dla nauczyciela

N/A
N/A
Protected

Academic year: 2022

Share "Wariancja. Wprowadzenie Przeczytaj Galeria zdjęć interaktywnych Sprawdź się Dla nauczyciela"

Copied!
15
0
0

Pełen tekst

(1)

Wariancja

Wprowadzenie Przeczytaj

Galeria zdjęć interaktywnych Sprawdź się

Dla nauczyciela

(2)

Na pewno wiesz, że Sahara to największa

najgorętsza pustynia na Ziemi. Zapewne kojarzy ci się z bezkresnym piaszczystym obszarem. A jak jest w rzeczywistości? Jak myślisz - ile procent

powierzchni Sahary pokrywa piasek?

Nie wiem jaką dasz odpowiedź, ale większość ludzi twierdzi, że około 80 %

, choć jest wręcz przeciwnie – tylko 15 %

powierzchni Sahary pokrywa piasek. Dzieje się tak dlatego, że powierzchnia pustyni jest bardzo zróżnicowana, w dużej mierze skalista.

Widać więc, że uśrednianie danych, w przypadku dużego ich zróżnicowania, może

całkowicie wypaczyć obraz pewnego zjawiska czy sytuacji. Aby unikać takich pułapek, w statystyce, oprócz miar tendencji centralnej, stosuje się jeszcze inne miary. Z niektórymi z nich zapoznasz się w tym materiale.

Twoje cele

Poznasz niektóre miary rozproszenia i porównasz je z miarami tendencji centralnej.

Obliczysz rozstęp, odchylenie przeciętne i wariancję danych przedstawionych w różny sposób.

Przeanalizujesz i zinterpretujesz wariancję danego zestawu danych statystycznych.

Wariancja

Pustynia kamienista – Sahara w Algierii

Źródło: Florence Devouard, licencja: CC BY-SA 3.0, [online], dostępny w internecie: commons.wikimedia.org.

(3)

Przeczytaj

Miary rozproszenia

Rozpatrzymy wyniki dwóch serii rzutów kostką do gry.

Seria 1 Seria 2

4, 4, 4, 4, 4 1, 3, 4, 6, 6

W obu przypadkach średnia arytmetyczna liczby wyrzuconych oczek jest równa 4 . Mediana obu zestawu danych też jest równa i wynosi 4

. Jednak oba te zestawy danych wyraźnie się różnią. Pierwszy zestaw nie jest zróżnicowany, a drugi – zróżnicowany. Widać więc, że zastosowanie miar tendencji centralnej nie opisuje dobrze różnic między tymi zestawami.

Aby więc analiza danych była pełniejsza, warto zastosować jeszcze charakterystyki zróżnicowania (rozproszenia) danych, zwane miarami rozproszenia (dyspersji). Miary te pozwalają na określenie, jak duże są różnice (odchylenia) między poszczególnymi wartościami jednostek zbiorowości, a ich wartością przeciętną (średnią).

Definicja: Miara rozproszenia

Miary rozproszenia (rozrzutu, zmienności, dyspersji) to miary charakteryzujące stopień zróżnicowania między sobą jednostek statystycznych pod względem badanej cechy.

Przykładowe miary rozproszenia to rozstęp, wariancja, odchylenie standardowe.

Rozstęp

Rozstęp jest miarą służącą do wstępnej analizy rozproszenia.

Definicja: Rozstęp

Rozstępem (obszarem zmienności) nazywamy różnicę między największą a najmniejszą wartością cechy w szeregu statystycznym.

Rozstęp oznaczamy literą R .

R = xmax- xmin gdzie:

xmax

– największa wartość cechy, xmin

– najmniejsza wartość cechy.

Przykład 1

W tabeli przedstawiono oceny z historii uzyskane przez Anię, Ewę i Julka.

Ania 4, 5, 6, 4, 5, 4, 6 Ewa 3, 4, 4, 4, 4, 3, 3, 3 Julek 2, 1, 3, 4, 4, 4, 3, 5

Obliczymy rozstęp ocen dla każdego z uczniów.

(4)

Ania: R = 6– 4 = 2 Ewa: R = 4– 3 = 1 Julek: R = 5– 1 = 4 Wniosek:

Najbardziej zróżnicowane oceny ma Julek, a najmniej Ewa.

Odchylenie przeciętne

Definicja: Odchylenie od średniej Odchyleniem wartości xi

cechy statystycznej od średniej arytmetycznej ˉx nazywamy liczbę xi- ˉx

.

Przykład 2

Policzono ile bombek zawieszono na 4

choinkach stojących na Placu Ratuszowym. Otrzymano następujące wyniki: 126 , 47

, 24 , 183 .

Obliczymy średnią arytmetyczną liczby bombek i dla każdego wyniku podamy odchylenie od średniej liczb bombek.

Rozwiązanie:

Obliczamy średnią arytmetyczną:

ˉx =

126 + 47+ 24+ 183

4 = 95

Obliczamy odchylenie od średniej.

xi 126 47 24 183

xi- ˉx |126 - 95| = 31 |47 - 95| = 48 |24 - 95| = 71 |183 - 95| = 88

Wniosek:

Największe odchylenie od średniej jest w przypadku choinki, na której zawieszono 183 bombki.

Miarą rozproszenia, która uwzględnia wszystkie dane rozkładu (a nie poszczególne elementy – tak jak odchylenie od średniej), jest odchylenie przeciętne (średnie).

Definicja: Odchylenie przeciętne

Odchyleniem przeciętnym zestawu danych statystycznych x1, x2, …, xn od ich średniej arytmetycznej ˉx

nazywamy liczbę:

| |

| |

(5)

d =

x1-x + xˉ 2-x + … + xˉ n-xˉ n

Przykład 3

Obliczymy odchylenie przeciętne dla zestawu danych z Przykładu 2 .

d =

31+ 48+ 71+ 88

4 = 59, 5 ≈ 60

Możemy powiedzieć, że liczby bombek na poszczególnych choinkach różnią się o ok. 60 od średniej dla wszystkich choinek.

Wariancja

Podstawową miarą zmienności obserwowanych wyników jest wariancja. Wariancja informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze danych – czy wyniki są bardziej czy mniej

skoncentrowane wokół średniej.

Definicja: Wariancja

Wariancją zestawu danych statystycznych x1, x2, …, xn

nazywamy średnią arytmetyczną kwadratów odchyleń od ich średniej arytmetycznej ˉx .

Wariancję oznaczamy symbolem σ2

– sigma) i określamy wzorem:

σ2=

x1-xˉ 2+ x2-xˉ 2+ … + xn-xˉ 2 n

Przykład 4

W loterii fantowej wzięły udział 3 osoby. Każda wyciągnęła 10

losów. Pierwsza z osób wyciągnęła 4 losy pełne, druga 6 , a trzecia 2

. Obliczymy wariancję wyciagnięcia losów pełnych.

Obliczamy średnią arytmetyczną liczb: 4 , 6

, 2 .

ˉx =

4+ 6+ 2

3 = 4

Obliczamy wariancję.

σ2=

(4-4)2+ (6-4)2+ (2-4)2

3 =

0+ 4+ 4

3 =

8 3 ≈ 2, 7 Wariancja jest równa w przybliżeniu 2, 7

.

Przykład 5

| | | | | |

( ) ( ) ( )

(6)

Obliczymy wariancję dla zestawu danych zapisanych w tabeli liczebności.

Wartość xi

cechy 2 4 6 10

Liczebność ni 2 5 1 2

Obliczamy średnią arytmetyczną.

ˉx =

2· 2+ 4· 5+ 6· 1+ 10· 2 2+ 5+ 1+ 2

=

4+ 20+ 6+ 20

10 = 5

Obliczymy wariancję.

σ2=

2· (2-5)2+ 5· (4-5)2+ 1· (6-5)2+ 2· (10-5)2 10

σ2=

2· 9+ 5· 1+ 1· 1+ 2· 25

10 =

74 10 = 7, 4 Wariancja dla podanego zestawu danych jest równa 7, 4

.

Przykład 6

Obliczymy rozstęp, średnią arytmetyczną, odchylenie przeciętne i wariancję dla zestawu danych: -4 , 10

, -1 , 0 , 5 .

Rozwiązanie:

Zapisujemy dane w postaci uporządkowanego szeregu statystycznego.

xi x1 x2 x3 x4 x5

-4 -1 0 5 10

Obliczamy rozstęp.

R = x5- x1= 10 - (-4) = 14 Obliczamy średnią arytmetyczną.

ˉx =

-4-1+ 0+ 5+ 10

5 = 2

Obliczamy odchylenie przeciętne.

d =

| -4-2| + |10-2| + | -1-2| + |0-2| + |5-2|

5 =

6+ 8+ 3+ 2+ 3 5 = 4, 4

Obliczamy wariancję.

σ2=

( -4-2)2+ (10-2)2+ ( -1-2)2+ (0-2)2+ (5-2)2 5

σ2=

62+ 82+ 32+ 22+ 32

5 =

122 5 = 24, 4

Na podstawie wartości uzyskanych parametrów zauważamy, że zróżnicowanie danych jest duże

(7)

(różnica między wartością największą a najmniejszą to aż 14 , wariancja to 24, 4

).

Słownik

wariancja zestawu danych statystycznych

średnia arytmetyczna kwadratów odchyleń od ich średniej arytmetycznej ˉx

(8)

Galeria zdjęć interaktywnych

Polecenie 1

Zapoznaj się z przykładami wyznaczania miar rozproszenia pokazanymi w galerii zdjęć interaktywnych.

Zinterpretuj w każdym przypadku uzyskane wyniki.

1. Średnia ocen {audio}Zauważ, że średnia ocen w każdym przypadku jest taka sama.

2. Rozstęp {audio}Wyznaczamy dla każdej grupy danych rozstęp, czyli w tym wypadku różnicę między oceną najwyższą a najniższą.

1. Obserwacje {audio}Obliczamy ile jest wszystkich obserwacji.

2. Średnia arytmetyczna {audio}Obliczamy średnią arytmetyczną.

3. Odchylenie od średniej {audio}Dla podanych wyników obliczamy odchylenie od średniej.

1

2

1

2

3

(9)

1. Odchylenie od przeciętnej {audio}Obliczamy odchylenie od przeciętnej.

1. Średnia arytmetyczna {audio}Najpierw obliczamy średnią arytmetyczną liczb wysłanych SMS – ów.

2. Wariancja {audio}Aby obliczyć wariancję, skorzystamy ze wzoru

1. Wariancja {audio}Podstawiamy dane do wzoru i obliczamy.

1

1

2

1

 

 

(10)

Polecenie 2

Dla zestawu danych: -6 , -2

, 0 , 2 , 6 , 12

oblicz rozstęp, średnią arytmetyczną, odchylenie przeciętne, wariancję.

(11)

Sprawdź się

Ćwiczenie 1

Dopasuj nazwę do odpowiedniego opisu.

Odchylenie od średniej, Średnia arytmetyczna, Rozstęp, Odchylenie przeciętne, Wariancja Wartość

bezwzględna różnicy między wartością cechy a średnią arytmetyczną Średnia arytmetyczna kwadratów odchyleń zestawu danych od ich średniej arytmetycznej Różnica między największą a najmniejszą wartością cechy w szeregu statystycznym Iloraz sumy odchyleń od średniej przez liczbę danych Iloraz sumy wartości danych przez ich liczbę

Ćwiczenie 2

Wskaż wszystkie zestawy danych, dla których rozstęp jest większy od 6.

-3, - 1, 6, 1, 4, 2, 8, 5 3, 4, 0, 9, 1, 10, 5, 7 7, 7, 8, 7, 10, 7, 13, 7 6, 2, 8, 5, 6, 4, 3, 2, 3

(12)

Ćwiczenie 3

Dane są różne liczby: 6, x, 10, gdzie x ≤ 10. Uzupełnij tabelę, wpisując odpowiednie liczby.

Średnia arytmetyczna Rozstęp 6

x

8 x Ćwiczenie 4

Pięć osób wybrało się na grzyby. Każda z tych osób znalazła odpowiednio: 6, 10, 7, 12, 5 grzybów.

Oblicz dla każdego wyniku odchylenie od średniej ˉx liczb zebranych grzybów. Przeciągnij odpowiedni wynik w prawidłowe miejsca.

2, 3, 5, 3, 4, 1, 5, 1, 2, 4

"|" 6 - ˉx "|" =

"|" 10 - ˉx "|" =

"|" 7 - ˉx "|" =

"|" 12 - ˉx "|" =

"|" 5 - ˉx "|" = Ćwiczenie 5

Sprzedawczyni zanotowała rozmiary sprzedanych tego dnia bluzek: 34, 38, 36, 42, 46, 38, 40, 38.

Korzystając z danych podanych przez sprzedawczynię, określ które z podanych zdań są prawdziwe.

Mediana tego zestawu danych jest równa rozstępowi.

Odchylenie przeciętne tego zestawu danych jest mniejsze od 3.

Mediana tego zestawu danych jest równa dominancie.

Średnia arytmetyczna tego zestawu danych jest ponad dziesięciokrotnie wyższa od odchylenia przeciętnego.

Wariancja rozmiarów sprzedanych bluzek jest równa 10, 8.

Odchylenie przeciętne tego zestawu danych jest równe 2, 75.

Ćwiczenie 6

Ustaw w odpowiedniej kolejności obliczenia prowadzące do wyznaczenia wariancji danych: 3, 4, 5.

Obliczenie średniej arytmetycznej: ˉx =

3+ 4+ 5

3 = 4

Wyznaczenie liczby danych: n = 1 + 1 + 1 = 3 Odpowiedź: σ2≈ 0, 7

Obliczenie wariancji: σ2=

12+ 02+ 12

3 =

2 3

Obliczenie odchylenia od średniej dla każdego wyniku:

"|" 3 - 4 "|" = 1, "|" 4 - 4 "|" = 0, "|" 5 - 4 "|" = 1

(13)

Ćwiczenie 7

Wariancja danych zapisanych w tabelce poniżej jest równa:

Wartość xi

cechy 1 2 4 10

Liczebność ni 2 5 2 1

3 5, 5 6, 4 55 Ćwiczenie 8

Maciek w tym semestrze otrzymał z geografii trzy czwórki, dwie piątki, cztery trójki i szóstkę. Oblicz wariancję dla tych danych.

(14)

Dla nauczyciela

Autor: Justyna Cybulska Przedmiot: Matematyka Temat: Wariancja Grupa docelowa:

III etap edukacyjny, liceum, technikum, zakres rozszerzony, klasa I lub II Podstawa programowa:

XII. Rachunek prawdopodobieństwa i statystyka. Zakres podstawowy.

Uczeń:

3) oblicza średnią arytmetyczną i średnią ważoną, znajduje medianę i dominantę;

4) oblicza odchylenie standardowe zestawu danych (także w przypadku danych odpowiednio pogrupowanych), interpretuje ten parametr dla danych empirycznych.

Kształtowane kompetencje kluczowe:

kompetencje w zakresie rozumienia i tworzenia informacji

kompetencje matematyczne oraz kompetencje w zakresie nauk przyrodniczych, technologii i inżynierii

kompetencje cyfrowe

kompetencje osobiste, społeczne i w zakresie umiejętności uczenia się Cele operacyjne:

Uczeń:

wyznacza rozstęp, odchylenie od średniej, odchylenie przeciętne i wariancję zestawu danych interpretuje i operuje informacjami przedstawionymi za pomocą tekstu lub tabeli

dobiera odpowiedni model matematyczny do sytuacji z kontekstem realistycznym Strategie nauczania:

konstruktywizm

Metody i techniki nauczania:

puzzle eksperckie kot i mysz

Formy pracy:

praca indywidualna praca w grupach

praca całego zespołu klasowego Środki dydaktyczne:

komputery z dostępem do Internetu w takiej liczbie, żeby każdy uczeń miał do dyspozycji komputer Przebieg lekcji

(15)

Faza wstępna:

1. Uczniowie przypominają poznane miary tendencji centralnej.

2. Nauczyciel przedstawia dwa zestawy danych (np. 10, 10, 10 i 1, 10, 19), których średnia arytmetyczna i mediana są takie same.

Dyskusja – czy miary tendencji centralnej dobrze opiszą rozrzut danych.

3. Nauczyciel podaje temat i cele zajęć, proponuje kryteria sukcesu.

Faza realizacyjna:

1. Praca w grupach metodą puzzli eksperckich. Poproszeni o to kilka dni wcześniej uczniowie, przygotowali materiały dotyczące istoty i sposobu obliczania rozstępu, odchylenia od średniej, odchylenia przeciętego i wariancji. Ich zadaniem jest przekazanie zdobytych informacji grupom, tak aby każdy uczeń potrafił obliczyć dane wielkości.

2. Uczniowie w parach zapoznają się z galerią zdjęć interaktywnych, a następnie metodą kot i mysz rozwiązują proponowane w materiale ćwiczenia interaktywne. Przy czym mysz stara się jak najlepiej rozwiązać zadania, a kot, sprawdza ich poprawność – po 2 nieudanych próbach – kot „łapie mysz”, która wypada z gry. Aby gra toczyła się dalej – teraz mysz staje się kotem i procedura się powtarza.

Faza podsumowująca:

1. Podsumowaniem zajęć jest dyskusja – czy poznane miary rozproszenia dobrze charakteryzują zebrane dane – co pomaga, a czego brakuje do dobrej interpretacji danych.

2. Uczniowie – eksperci opowiadają o pracy grup, dzielą się swoimi spostrzeżeniami, zwracają uwagę na mocne i słabe strony pracy.

3. Uczniowie dokonują oceny koleżeńskiej partnerów z zabawy – kot i mysz.

Praca domowa:

Nauczyciel poleca, aby uczniowie poszukali w dostępnych źródłach informacji innego, niż poznany na zajęciach, wzoru na wariancję i udowodnili go.

Materiały pomocnicze:

Miary rozproszenia Wskazówki metodyczne:

Z galerią zdjęć interaktywnych uczniów mogą zapoznać eksperci, omawiając odpowiednie pojęcia.

Cytaty

Powiązane dokumenty

w trójkącie prostokątnym jest to stosunek długości przyprostokątnej leżącej naprzeciw kąta do długości przeciwprostokątnej... Galeria

Do grupy tych związków organicznych zalicza się zarówno lotne związki o przyjemnym zapachu, jak i tłuszcze.. W wielu dziedzinach życia

ciągiem nieskończonym nazywamy funkcję, której dziedziną jest zbiór liczb naturalnych dodatnich ciąg skończony.. ciągiem skończonym nazywamy funkcję, której dziedziną jest

W poniższym szeregu uporządkowanym, składającym się z 7 elementów, element czwarty, czyli 5 , jest elementem środkowym, zatem kwantylem rzędu 12 (po prawej i po lewej stronie liczby

zapoczątkowana przez Talesa szkoła filozoficzna; oprócz Talesa zalicza się do niej dwu filozofów – Anaksymandra i Anaksymenesa; szkole tej zawdzięczamy sformułowanie

Źródło: Wojciech Ligęza, Wstęp , [w:] Wisława Szymborska, Wybór poezji , Wrocław

Zauważają, że funkcja wykładnicza ma zastosowanie do obliczania wysokości kapitału złożonego na określony czas przy ustalonym oprocentowaniu lub przy braniu kredytów..

Poniższe przykłady pokazują w jaki sposób możemy próbować obliczyć granice pewnych typów funkcji w punktach nienależących do ich dziedziny..