Co to jest korelacja?

Zobacz jak obliczyć współczynnik korelacji linioweja Pearsona na YouTube!

Co to jest korelacja?

Odpowiedź na pytanie co to jest korelacja zacznę od zadania pomocniczych pytań.

Czy pomiędzy zarobkami a wydatkami na lody istnieje jakiś związek?
Czy pomiędzy ceną lodów a tym ile ich kupuję istnieje jakiś związek?
Czy pomiędzy czasem poświęconym na naukę statystyki a oceną z kolokwium istnieje jakiś związek?

Przy odrobinie dobrej woli na wszystkie te pytania można odpowiedzieć twierdząco.
Tak istnieje związek. Im więcej zarabiam tym więcej mogę kupić lodów. Im mniej zarabiam tym (niestety) lodów mogę kupić mniej.
Tak istnieje związek. Im lody są droższe tym mniej ich kupuję. Im są tańsze tym kupuję ich więcej!
Tak istnieje związek. Gdy uczę się dużo mam dobrą ocenę. Gdy uczę się mało kolokwium jest niezaliczone.

Zatem między tymi parami cech (zarobki i wydatki na lody, cena lodów i ilość kupowanych przeze mnie lodów, czas nauki i ocena) istnieje związek. Taki związek nazywamy właśnie korelacją.

Korelacja (współzależność, współwystępowanie)  - czyli coś na coś wpływa, coś od czegoś zależy.

Mogą być trzy przypadki:
1. Między cechami występuje korelacja dodatnia.
2. Między cechami występuje korelacja ujemna.
3. Między cechami nie wystepuje korelacja.

Co to znaczy, że między cechami występuje korelacja dodatnia?

Weźmy przykład z zarobkami i wydatkami na lody. Im więcej zarabiam tym więcej mogę wydać na lody. Im mniej zarabiam tym mniej mogę wydać na lody. Zmiany wartości obu cech następują w tym samym kierunku. Albo obie rosną (zarobki i ilość kupowanych lodów rośnie) albo obie maleją (zarobki i ilość kupowanych lodów maleje).

Korelacja dodatnia oznacza, że wartości obu cech zmieniają się w tym samym kierunku (obie rosną bądź obie maleją).

Co to znaczy, że między cechami występuje korelacja ujemna?

Jeśli cena lodów rośnie kupuję ich mniej (jakby pudełko lodów kosztowało 1000zł w ogóle bym ich nie kupował).
Gdy cena lodów spada kupuję ich więcej (gdyby pudełko lodów kosztowało 1zł, codziennie na śniadanie jadłbym jedno - ze stratą dla mojej sylwetki no ale coś za coś…).
Zmiany wartości obu cech następują w przeciwnych kierunkach. Gdy wartości jednej cechy rosną (rośnie cena lodów), wartości drugiej cechy maleją (kupuję mniej lodów). I na odwrót. Gdy wartości jednej cechy maleją (maleje cena lodów), wartości drugiej cechy rosną (kupuję więcej lodów).

Korelacja ujemna oznacza, że wartości obu cech zmieniają się w przeciwnym kierunku (gdy jedna rośnie, druga maleje).

Co to znaczy, że między cechami nie występuje korelacja?

Czy pomiędzy moimi zarobkami a liczbą bocianów na łące istnieje jakiś związek?
Nie, nie ma związku. Moje zarobki nie wpływają na liczbę bocianów (no chyba, że bym je dokarmiał kupując żaby)  ani liczba bocianów nie wpływa na moje zarobki! Między tymi cechami nie ma związku - czyli nie ma korelacji!

W jaki sposób obliczyć korelację?

To, że między zarobkami a wydatkami na lody istnieje korelacja jest tylko przypuszczeniem (graniczącym z pewnością ale wciąż przypuszczeniem). Aby być tego pewnym musimy to… policzyć!

Jest wiele miar służących do wyliczania korelacji między badanymi cechami. Najpopularniejszymi z nich są:

1. Współczynnik korelacji liniowej Pearsona.
2. Współczynnik korelacji rang Spearmana.
3. Współczynnik zbieżności Czuprowa.

W kolejnych lekcjach na przykładach pokażę sposoby obliczania korelacji za pomocą tych trzech miar.

Comments are closed.