Jak obliczyć odchylenie standardowe?

Zapraszam do obejrzenia lekcji na YouTube!

Witaj na kolejnej lekcji statystyki ludzkim głosem! Dziś zajmiemy się odchyleniem standardowym. Jak zwykle zakładam, że przerobiłeś już zadania z poprzednich lekcji i takich pojęć jak średnia arytmetyczna nie musimy już tłumaczyć.

Ważne jest abyś przed przystąpieniem do tej lekcji miał już opanowane obliczanie wariancji.

Zanim zabierzemy się za licznie wyjaśnijmy sobie co to takiego jest to odchylenie standardowe?

Do czego potrzebna jest nam kolejna miara?

Jak pamiętasz ze wstępu statystyka “to nauka, która ułatwia poznanie jakiegoś skomplikowanego wycinka rzeczywistości. Pozwala ogarnąć coś, co na pierwszy rzut oka może przytłaczać ilością elementów i stopniem skomplikowania. Pomaga wprowadzić porządek tam gdzie na pozór panuje chaos.”

Dla przykładu niech tym “skomplikowanym wycinkiem rzeczywistości” będą miesięczne wydatki na kino wszystkich studentów danej uczelni. Powiedzmy, że studentów jest 1500. Celem jest dowiedzenie się jak wyglądają ich wydatki miesięczne na kino?

Zamiast otrzymać listę 1500 liczb z wydatkami poszczególnych studentów możemy policzyć średnie wydatki i otrzymamy tylko jedną liczbę! Powiedzmy, że po obliczeniach otrzymamy średnią arytmetyczną 50zł.

Czy to znaczy, że każdy student wydał dokładnie 50zł na kino? Oczywiście, że nie! Jak pamiętasz z lekcji o średniej arytmetycznej miara ta działa jak socjalizm. Zabiera tym co mają za dużo i oddaje tym co mają za mało tak aby wszyscy mieli po równo.

Weźmy taki przykład: Kasia wydaje 70zł na kino, Marek 50zł a Ala w ogóle nie chodzi do kina. Jakie są ich średnie wydatki na kino? Policzmy:

overline{x}=(70+50+0)/3=40

Czyli średnie wydatki na kino wynoszą 40zł. Ale przecież Kasia wydaje aż 70zł! A Ala w ogóle nie chodzi do kina. Jak widać średnia może nas mylić, oszukiwać.

Co możemy zrobić aby otrzymać bardziej wiarygodne wyniki? Aby obraz wydatków na kino naszych studentów lepiej oddawał rzeczywistość? Musimy policzyć kolejne miary, które nam ten obraz wyostrzą. Jedną z takich miar “wyostrzających” obraz jest właśnie odchylenie standardowe.

Zwróć uwagę, że nawet jeśli policzymy dwie, trzy a nawet i dziesięć miar (np. średnia, mediana, odchylenie standardowe itd.) to i tak jesteśmy do przodu. Łatwiej przecież odczytać dziesięć liczb i mieć w miarę dobry obraz rzeczywistości (wydatków studentów na kino) niż przeglądać 1500 liczb reprezentujących wydatki poszczególnych studentów.

Co to jest to odchylenie standardowe?

Najprościej mówiąc odchylenie standardowe to miara, która mówi nam o średnim odchyleniu od średniej arytmetycznej. Troszkę masło maślane? Przejdźmy do przykładu.

Wróćmy do naszych studentów Kasi, Marka i Ali. Jak wiemy ich średnie wydatki na kino wynoszą 40zł. Ale Kasia wydaje o 30zł więcej, Marek o 10zł więcej a Ala o 40zł mniej (bo nic nie wydaje). Te 30zł, 10zł i -40zł to odchylenia od średniej. O tyle odchylają się wydatki poszczególnych osób od średniej. No dobrze a jakby tych studentów nie było trzech tylko 1500? Wtedy znowu musielibyśmy wypisać 1500 liczb z odchyleniami wydatków poszczególnych osób od średniej. Czy miałoby to sens? Raczej nie. Wpadlibyśmy z deszczu pod rynnę.

Dlatego może warto byłoby policzyć średnią z tych odchyleń? I zamiast 1500 liczb otrzymalibyśmy jedną informującą o… średnim odchyleniu od średniej! Czyli właśnie nasze odchylenie standardowe!

Jak dotąd wszystko brzmi rozsądnie mam nadzieję. Spróbujmy zatem policzyć średnią z odchyleń dla naszej trójki studentów.

średnia z odchyleń = (30+10+(-40))/3=0/3=0

Czyli co? Średnio wydatki na kino Kasi, Marka i Ali odchylały się od 40zł (czyli ich średnich wydatków) o 0zł? Coś tu nie gra!

Zgadza się! Słuszna uwaga! Ale co? Otóż warto zapamiętać, że suma odchyleń od średniej zawsze wynosi zero! (30 + 10 + (-40) = 0). Czyli licząc w ten sposób zawsze otrzymamy w wyniku zero.

Czas najwyższy zaprezentować wzór na odchylenie standardowe w szeregu szczegółowym:

s=sqrt{sum{}{}{(x_i - overline{x})^2}/n}

Jeżeli przerobiłeś już lekcję o wariancji z pewnością dostrzeżesz, że to co pod pierwiastkiem to właśnie wariancja! Zatem odchylenie standardowe to pierwiastek z wariancji. Mając obliczoną wariancję wystarczy wynik spierwiastkować i mamy wartość odchylenia standardowego.

Zwróć uwagę, że w liczniku mam sumę odchyleń poszczególnych wartości od średniej podniesionych do kwadratu. I właśnie to, że podnosimy odchylenia do kwadratu gwarantuje, że sumując je potem nie otrzymamy zawsze zera. Co prawda podnosząc wartości do kwadratu otrzymujemy śmieszne jednostki (np. złotówki kwadrat) ale licząc odchylenie pierwiastkujemy wariancję i z powrotem wracamy do właściwych jednostek (np. złotówek).

Obliczmy teraz odchylenie standardowe od początku do końca na naszym przykładzie ze studentami.

Zadanie
Miesięczne wydatki (w złotówkach) trójki studentów na kino wyglądały następująco:

70, 50, 0

Polecenie
Oblicz i zinterpretuj wartość odchylenia standardowego.

Rozwiązanie
Potrzebujemy wzór na odchylenie standardowe. Oto wzór.

s=sqrt{s^2}

Oznaczenia:
s - to symbol odchylenia standardowego
s^2 - to symbol wariancji

Jak widzimy odchylenie standardowe to po prostu pierwiastek z wariancji. Wzór ten jest prawdziwy dla wszystkich rodzajów szeregów.

Musimy zatem obliczyć wariancję. Aby obliczyć wariancję musimy wybrać wzór odpowieni dla danego szeregu. Tutaj mamy do czynienia z szeregiem szczegółowym (zobacz rodzaje szeregów statystycznych).

s^2=sum{}{}{(x_i - overline{x})^2}/n

Sposób wyliczania wariancji w szeregu szczegółowym opisałem w lekcji
Jak obliczyć wariancję w szeregu szczegółowym?. Tutaj podam tylko wartość wyliczonej wariancji.

s^2=((70-40)^2 + (50-40)^2 + (0-40)^2)/3 = 866,67 (zl^2)

Pierwiastkujemy wariancję aby otrzymać wartość odchylenia standardowego:

s=sqrt{s^2}=sqrt{866,67}=29,44 (zł)

Interpretacja
Średnie wydatki studentów na kino wynoszą 40zł. Wydatki poszczególnych studentów odchylają się od tej wartości średnio o 29,44zł.

I jeszcze bardziej po ludzku:

Studenci średnio wydają na kino 40zł ale większość wydaje 40zł +/- 29,44zł.

Wartość typowa. Typowy obszar zmienności

Na koniec powiedzmy sobie jeszcze jednym zdaniem o wartości typowej oraz o typowym obszarze zmienności. Poniżej wzór na typowy obszar zmienności:

overline{x}-s<x_typ<overline{x}+s

I od razu podstawmy liczby dla jasności wykładu:

40 - 29,44 = 10,56 < x_typ < 40 + 29,44 = 69,44

Czyli wartość typowa to wydatki z przedziału 10,56zł a 69,44zł. Aby nie komplikować niepotrzebnie powiedzmy sobie, że w tym obszarze zawiera się większość obserwacji badanej cechy. W naszym zadaniu oznacza to po prostu, że:

Większość studentów wydaje na kino miesięcznie między 10,56zł a 69,44zł.

Na tym zakończę lekcję o odchyleniu standardowym. Zapraszam do kolejnych wykładów statystyki ludzkim głosem!

Comments are closed.