Jak obliczyć odchylenie standardowe?

Zapraszam do obejrzenia lekcji na YouTube!

Witaj na kolejnej lekcji statystyki ludzkim głosem! Dziś zajmiemy się odchyleniem standardowym. Jak zwykle zakładam, że przerobiłeś już zadania z poprzednich lekcji i takich pojęć jak średnia arytmetyczna nie musimy już tłumaczyć.

Ważne jest abyś przed przystąpieniem do tej lekcji miał już opanowane obliczanie wariancji.

Zanim zabierzemy się za licznie wyjaśnijmy sobie co to takiego jest to odchylenie standardowe?

Do czego potrzebna jest nam kolejna miara?

Jak pamiętasz ze wstępu statystyka “to nauka, która ułatwia poznanie jakiegoś skomplikowanego wycinka rzeczywistości. Pozwala ogarnąć coś, co na pierwszy rzut oka może przytłaczać ilością elementów i stopniem skomplikowania. Pomaga wprowadzić porządek tam gdzie na pozór panuje chaos.”

Dla przykładu niech tym “skomplikowanym wycinkiem rzeczywistości” będą miesięczne wydatki na kino wszystkich studentów danej uczelni. Powiedzmy, że studentów jest 1500. Celem jest dowiedzenie się jak wyglądają ich wydatki miesięczne na kino?

Zamiast otrzymać listę 1500 liczb z wydatkami poszczególnych studentów możemy policzyć średnie wydatki i otrzymamy tylko jedną liczbę! Powiedzmy, że po obliczeniach otrzymamy średnią arytmetyczną 50zł.

Czy to znaczy, że każdy student wydał dokładnie 50zł na kino? Oczywiście, że nie! Jak pamiętasz z lekcji o średniej arytmetycznej miara ta działa jak socjalizm. Zabiera tym co mają za dużo i oddaje tym co mają za mało tak aby wszyscy mieli po równo.

Weźmy taki przykład: Kasia wydaje 70zł na kino, Marek 50zł a Ala w ogóle nie chodzi do kina. Jakie są ich średnie wydatki na kino? Policzmy:

overline{x}=(70+50+0)/3=40

Czyli średnie wydatki na kino wynoszą 40zł. Ale przecież Kasia wydaje aż 70zł! A Ala w ogóle nie chodzi do kina. Jak widać średnia może nas mylić, oszukiwać.

Co możemy zrobić aby otrzymać bardziej wiarygodne wyniki? Aby obraz wydatków na kino naszych studentów lepiej oddawał rzeczywistość? Musimy policzyć kolejne miary, które nam ten obraz wyostrzą. Jedną z takich miar “wyostrzających” obraz jest właśnie odchylenie standardowe.

Zwróć uwagę, że nawet jeśli policzymy dwie, trzy a nawet i dziesięć miar (np. średnia, mediana, odchylenie standardowe itd.) to i tak jesteśmy do przodu. Łatwiej przecież odczytać dziesięć liczb i mieć w miarę dobry obraz rzeczywistości (wydatków studentów na kino) niż przeglądać 1500 liczb reprezentujących wydatki poszczególnych studentów.

Co to jest to odchylenie standardowe?

Najprościej mówiąc odchylenie standardowe to miara, która mówi nam o średnim odchyleniu od średniej arytmetycznej. Troszkę masło maślane? Przejdźmy do przykładu.

Wróćmy do naszych studentów Kasi, Marka i Ali. Jak wiemy ich średnie wydatki na kino wynoszą 40zł. Ale Kasia wydaje o 30zł więcej, Marek o 10zł więcej a Ala o 40zł mniej (bo nic nie wydaje). Te 30zł, 10zł i -40zł to odchylenia od średniej. O tyle odchylają się wydatki poszczególnych osób od średniej. No dobrze a jakby tych studentów nie było trzech tylko 1500? Wtedy znowu musielibyśmy wypisać 1500 liczb z odchyleniami wydatków poszczególnych osób od średniej. Czy miałoby to sens? Raczej nie. Wpadlibyśmy z deszczu pod rynnę.

Dlatego może warto byłoby policzyć średnią z tych odchyleń? I zamiast 1500 liczb otrzymalibyśmy jedną informującą o… średnim odchyleniu od średniej! Czyli właśnie nasze odchylenie standardowe!

Jak dotąd wszystko brzmi rozsądnie mam nadzieję. Spróbujmy zatem policzyć średnią z odchyleń dla naszej trójki studentów.

średnia z odchyleń = (30+10+(-40))/3=0/3=0

Czyli co? Średnio wydatki na kino Kasi, Marka i Ali odchylały się od 40zł (czyli ich średnich wydatków) o 0zł? Coś tu nie gra!

Zgadza się! Słuszna uwaga! Ale co? Otóż warto zapamiętać, że suma odchyleń od średniej zawsze wynosi zero! (30 + 10 + (-40) = 0). Czyli licząc w ten sposób zawsze otrzymamy w wyniku zero.

Czas najwyższy zaprezentować wzór na odchylenie standardowe w szeregu szczegółowym:

s=sqrt{sum{}{}{(x_i - overline{x})^2}/n}

Jeżeli przerobiłeś już lekcję o wariancji z pewnością dostrzeżesz, że to co pod pierwiastkiem to właśnie wariancja! Zatem odchylenie standardowe to pierwiastek z wariancji. Mając obliczoną wariancję wystarczy wynik spierwiastkować i mamy wartość odchylenia standardowego.

Zwróć uwagę, że w liczniku mam sumę odchyleń poszczególnych wartości od średniej podniesionych do kwadratu. I właśnie to, że podnosimy odchylenia do kwadratu gwarantuje, że sumując je potem nie otrzymamy zawsze zera. Co prawda podnosząc wartości do kwadratu otrzymujemy śmieszne jednostki (np. złotówki kwadrat) ale licząc odchylenie pierwiastkujemy wariancję i z powrotem wracamy do właściwych jednostek (np. złotówek).

Obliczmy teraz odchylenie standardowe od początku do końca na naszym przykładzie ze studentami.

Zadanie
Miesięczne wydatki (w złotówkach) trójki studentów na kino wyglądały następująco:

70, 50, 0

Polecenie
Oblicz i zinterpretuj wartość odchylenia standardowego.

Rozwiązanie
Potrzebujemy wzór na odchylenie standardowe. Oto wzór.

s=sqrt{s^2}

Oznaczenia:
s - to symbol odchylenia standardowego
s^2 - to symbol wariancji

Jak widzimy odchylenie standardowe to po prostu pierwiastek z wariancji. Wzór ten jest prawdziwy dla wszystkich rodzajów szeregów.

Musimy zatem obliczyć wariancję. Aby obliczyć wariancję musimy wybrać wzór odpowieni dla danego szeregu. Tutaj mamy do czynienia z szeregiem szczegółowym (zobacz rodzaje szeregów statystycznych).

s^2=sum{}{}{(x_i - overline{x})^2}/n

Sposób wyliczania wariancji w szeregu szczegółowym opisałem w lekcji
Jak obliczyć wariancję w szeregu szczegółowym?. Tutaj podam tylko wartość wyliczonej wariancji.

s^2=((70-40)^2 + (50-40)^2 + (0-40)^2)/3 = 866,67 (zl^2)

Pierwiastkujemy wariancję aby otrzymać wartość odchylenia standardowego:

s=sqrt{s^2}=sqrt{866,67}=29,44 (zł)

Interpretacja
Średnie wydatki studentów na kino wynoszą 40zł. Wydatki poszczególnych studentów odchylają się od tej wartości średnio o 29,44zł.

I jeszcze bardziej po ludzku:

Studenci średnio wydają na kino 40zł ale większość wydaje 40zł +/- 29,44zł.

Wartość typowa. Typowy obszar zmienności

Na koniec powiedzmy sobie jeszcze jednym zdaniem o wartości typowej oraz o typowym obszarze zmienności. Poniżej wzór na typowy obszar zmienności:

overline{x}-s<x_typ<overline{x}+s

I od razu podstawmy liczby dla jasności wykładu:

40 - 29,44 = 10,56 < x_typ < 40 + 29,44 = 69,44

Czyli wartość typowa to wydatki z przedziału 10,56zł a 69,44zł. Aby nie komplikować niepotrzebnie powiedzmy sobie, że w tym obszarze zawiera się większość obserwacji badanej cechy. W naszym zadaniu oznacza to po prostu, że:

Większość studentów wydaje na kino miesięcznie między 10,56zł a 69,44zł.

Na tym zakończę lekcję o odchyleniu standardowym. Zapraszam do kolejnych wykładów statystyki ludzkim głosem!

Komentarzy: 16

  1. brawo! super lekcja! dziękuję! :) szkoda że nie ma kwartyli :P bo bym umiała na kolokwium perfect :)

  2. A w szeregu przedziałowym czy można również poprosić o pomoc ?? (odchylenie standardowe i wariancja)

    Z góry dziękuję i pozdrawiam,

    M.K.

  3. Twoje lekcje są naprawdę ciekawe ale dla kogoś kto potrzebuje elementarnej pomocy. Może mógłbyś zamieścić jedną zaawansowaną lekcję np. z nieparametrycznymi testami albo z testem F,studenta…
    Pozdrawiam

  4. @Maks
    Staram się zamieszczać kolejne lekcje ale praca i inne takie przeszkadzajki trochę to utrudniają :)

    @Magda
    Piszę lekcje w kolejności zgodnej z programem nauczania statystyki na uczelniach o profilu ekonomicznym. Nie chcę pisać wyrywkowych lekcji. Kolejne wykłady umieszczam na stronie jak tylko znajduję czas na ich przygotowanie. Zatem trudniejsze tematy pojawią się ale w odpowiednim czasie.

    Pozdrawiam,
    Przemek

  5. Hej,

    Mogę prosić chociaż o sam wzór na WARIANCJĘ w szeregu rozdzi. punktowym? Bo odchylenie standardowe jest zawsze pierwiastek z wariancji.
    Wiem, że wariancja dla szeregu rozdzi. przedziałowego to: SUMA(środek przedziału - średnia arytmetyczna)podniesione do kwadratu *ni/N
    A jak jest dla punktowego???

    Bardzo proszę o pomoc. mam nadzieje do środy że sie uda podac.
    Z góry dzieki, Pozdrawiam.

  6. Witaj Asiu,
    wzór na wariancję w szeregu rozdzielczym punktowym jest taki sam jak podałaś dla szeregu przedziałowego tylko zamiast środków przedziałów podstawiasz do wzoru wartości kolejnych x - czyli warianty cechy (xi).
    Pozdrawiam,
    Przemek

  7. mega strona! bardzo pomocna! uporządkowała moja wiedzę hura!!! :D

  8. Dziękuję naprawdę można dużo zrozumieć!!Mam pytanie jak obliczyć współczynnik zmienności?, co to jest błąd pomiaru?

  9. Hej. Świetna interpretacja materiału:)
    Tylko szkoda że tak tego mało;/
    Studiuje finanse i w tym semestrze musimy w ciągu 15 godz ćw przerobić 60, więc trochę ciężko jest nam ogarnąć cały materiał:(
    A tu niedługo pierwsze kolokwium…
    Możliwe by było, że dodasz jeszcze więcej materiałów?
    przydało by się trochę statystyki matematycznej, asymetrie, miary dyspersji, wyznaczanie miar na diagramach, przedziały ufności, hipotezy(wnioskowanie statystyczne), analiza wspózalezności, itp
    Byłabym bardzo wdzięczna gdyby lekcje na te tematy się pojawiły, i chyba nie tylko ja:)
    Pozdrawiam i bardzo dziękuję za dotychczasowe lekcje:)

  10. Jest Pan genialny, mam nadzieję że kontynuuje pan te lekcje ;)
    Pozdrawiam

  11. Mam pytanie do odchylenia. Znalazłem wzory, gdzie dzieli się przez n-1, a nie przez n. Z czego to wynika i jak to wytłumaczyć?

  12. Witam. Jestem wciąż w szoku, że takie wspaniałe lekcje są za darmo w sieci. Chciałbym podziękować za pomoc w nauce do kolokwium. Może nie wszystko jest, czego potrzbuję, ale dzięki tej wiedzy jestem w stanie nauczyć się reszty samodzielnie. Mam pytanie: Czy jeśli wyśle sms’a, to, te pieniądze dojdą? Dawno nie było aktualizacji i ktoś inny moglby przejac ten “adres”. Jeśli nic się nie zmieniło, wyślę smska, nawet dwa :)

  13. Pięknie wyjaśnione. Super.

  14. Planujesz jeszcze wrzucać więcej lekcji? Pozdrawiam :)

  15. Ze wzorem na SD jest wszystko okej, ale co do wariancji coś mi się nie zgadza, a mianowicie nasz profesor na wykładach z metodologii i statystyki uczył nas, że we wzorze na wariancję dzielimy wszystko przez N-1 , nie przez samo N.
    Jakieś refleksje? Wyjaśnienia?

  16. O ku**a, oświeciło mnie. DZIĘKI. :)

Dodaj swój komentarz