Funkcja Excel CORREL - Oblicz korelację statystyczną

Pobierz przykładowy skoroszyt

Pobierz przykładowy skoroszyt

Ten samouczek pokazuje, jak używać Funkcja WSPÓŁRZĘDNOŚCI Excel w programie Excel, aby obliczyć korelację.

Przegląd funkcji CORREL

Funkcja CORREL Oblicza korelację dwóch serii liczb.

Aby użyć funkcji arkusza kalkulacyjnego CORREL Excel, wybierz komórkę i wpisz:

(Zwróć uwagę, jak pojawiają się dane wejściowe formuły)

Funkcja CORREL Składnia i wejścia:

1 =WSPÓŁPRACA(tablica1;tablica2)

tablica1 - Tablice liczb.

Co to jest funkcja WSPÓŁRZĘDNA?

Funkcja Excel CORREL zwraca współczynnik korelacji ( . Pearsona r) dwóch zakresów danych.

Jaki jest współczynnik korelacji?

Współczynnik korelacji, zwykle określany jako Pearsona r (nazwana na cześć Karla Pearsona, osoby, która ją opracowała), jest statystyką, która mówi, jak silnie dwie zmienne są ze sobą powiązane.

Pearsona r jest liczbą od -1 do 1, co może prowadzić do trzech możliwych interpretacji: korelacji dodatniej, korelacji ujemnej i braku korelacji.

Pozytywna korelacja

Dodatnia korelacja (r > 0) oznacza, że ​​gdy te dwie zmienne występują w parze – kiedy obserwujesz wysoki wynik w jednej zmiennej, masz tendencję do obserwowania również wysokiego wyniku w drugiej. Podobnie, gdy jedna zmienna jest niska, druga również ma tendencję do bycia niską.

Na przykład wzrost i waga mają dodatnią korelację. Zobacz poniższy wykres, który przedstawia wzrost i wagę małej próbki graczy w baseball:

ten r tej małej próby wynosi 0,73 – bardzo silna korelacja dodatnia. Ma to sens logicznie - wyżsi ludzie są średnio ciężsi, ponieważ ten dodatkowy wzrost składa się z kości, mięśni i innych tkanek, które wszystkie coś ważą.

Ale korelacja nie jest idealna (w doskonałej korelacji z an r 1, wszystkie wyniki padłyby na linię trendu). Niektóre niższe osoby mogą być cięższe – może noszą trochę dodatkowego tłuszczu lub ćwiczą na siłowni. Podobnie niektórzy wysocy ludzie mogą być bardzo szczupli i w rzeczywistości ważą mniej niż wiele niższych osób.

Korelacja tutaj jest prawdopodobnie tak wysoka, ponieważ mamy do czynienia ze sportowcami, byłaby niższa w całej populacji. Pamiętaj, aby o tym pamiętać podczas korzystania z CORREL - the r nie jest ostateczna – musisz zastanowić się, jakie są Twoje dane i jak je uzyskałeś podczas dokonywania interpretacji.

Ujemna korelacja

Korelacja ujemna (r < 0) oznacza, że ​​kiedy obserwujesz wysoki wynik w jednej zmiennej, masz tendencję do obserwowania niskiego wyniku w drugiej zmiennej i odwrotnie.

Na przykład wyniki testów uczniów i liczba nieobecności w szkole są ujemnie skorelowane. Oznacza to, że im więcej dni przegapią, tym niższe wydają się być ich wyniki. Im mniej dni przegapią, tym wyższe są wyniki:

Ponownie korelacja nie jest idealna (ponieważ prawie nigdy nie jest). Mamy tu jednego studenta, który opuścił 5 dni, ale mimo to udało mu się zdobyć 85%. Mamy też jednego, który zdobył 52%, mimo że zabrakło mu tylko dwóch dni.

Nadal mamy wyraźny negatywny trend. Ale nadal istnieje wiele różnic w wynikach testów, których nie można wyjaśnić samą nieobecnością. Może to wynikać z innych zmiennych, takich jak uzdolnienia, motywacja, zdrowie i wiele innych potencjalnych czynników.

Dlatego korzystając z CORREL należy pamiętać, że istnieje większy obraz, którego dane mogą nie wyjaśniać w pełni.

Brak powiązań

Brak powiązań (r = 0 lub jest blisko 0) oznacza, że ​​nie można przewidzieć wyniku jednej zmiennej na podstawie innej. Jeśli wykreślisz dane, nie zobaczysz dostrzegalnego trendu, a linia trendu będzie płaska lub prawie płaska.

Oto kilka danych dotyczących długości palca serdecznego i IQ:

Jak widać, nie ma związku między tymi dwiema zmiennymi w tej próbce, więc możemy założyć, że nie są one powiązane.

W praktyce raczej nie dostaniesz r dokładnie 0. Pamiętaj, że podczas zbierania danych często występują pewne różnice spowodowane błędem, na przykład w pomiarach lub raportowaniu. Więc tylko dlatego, że twoja r nie jest dokładnie 0, nie oznacza, że ​​coś znalazłeś.

Korelacja nie jest przyczyną

Należy pamiętać, że CORREL nie może powiedzieć, która zmienna ma wpływ na drugą – ani nawet, czy istnieje jakikolwiek związek przyczynowy między zmiennymi. Na przykład znaleziono korelację między następującymi zmiennymi:

  • Ilość sprzedanych lodów i ilość przestępstw z użyciem przemocy
  • Jak bardzo jesteś szczęśliwy i jakie masz sukcesy w swojej karierze
  • Liczba osób, które utonęły w basenie i liczba filmów, w których pojawiał się Nicolas Cage rocznie

Pierwszym przykładem jest trzecia zmienna problem. Oczywiście lody nie powodują, że ludzie stają się agresywni, ani angażowanie się w przemoc nie wywołuje pragnienia mrożonego mleka i cukru. Trzecią zmienną jest pogoda. W czasie upałów ludzie po prostu częściej wychodzą na zewnątrz - jest więcej kontaktów między ludźmi, a tym samym większe prawdopodobieństwo wybuchu konfliktu. W czasie upałów ludzie kupują też więcej lodów. Tak więc sprzedaż lodów i brutalna przestępczość są ze sobą powiązane tylko dlatego, że są powiązane z trzecią zmienną.

Drugi może być przykładem podwójna przyczynowość. Odnoszenie sukcesów w pracy może być dobre dla twojego szczęścia – zarobisz więcej pieniędzy i ogólnie będziesz miał większą kontrolę nad tym, jaką pracę wykonujesz i z kim ją wykonujesz. Ale szczęście może być również korzystne dla sukcesu, może szczęśliwsi ludzie łatwiej się dogadują i rozwijają silniejsze relacje zawodowe, a może są bardziej odporni psychicznie na niepowodzenia. W tym przypadku obie zmienne wpływają na siebie nawzajem.

Trzeci to po prostu fałszywa korelacja. Tylko dlatego, że dwie zmienne są skorelowane w Twoich danych, nie oznacza to, że w jakikolwiek sposób wchodzą w interakcje w prawdziwym życiu.

Najważniejsze jest to, że korelacja nie może powiedzieć, czy dwie zmienne są powiązane przyczynowo.

Jak korzystać z CORREL

Użyj funkcji Excel CORREL w następujący sposób:

1 =WSPÓŁPRACA(B3:B15;C3:C15)

Za pomocą CORREL definiujesz dwa argumenty - dwa zakresy danych, które chcesz skorelować.

Oto kilka kluczowych punktów, o których należy pamiętać przy CORREL:

  • Tekst, Boolean (PRAWDA/FAŁSZ) i puste komórki są ignorowane.
  • Oba zakresy danych muszą mieć taką samą liczbę punktów danych, w przeciwnym razie otrzymasz błąd #N/A
  • Jeśli jeden z zakresów danych jest pusty, lub jeśli nie ma żadnej zmiany w danych (tj. Jeśli wszystkie punkty danych mają tę samą liczbę), otrzymasz #DIV/0! Błąd

Funkcja CORREL w Arkuszach Google

Funkcja CORREL działa dokładnie tak samo w Arkuszach Google, jak w Excelu:

Dodatkowe uwagi

Przykłady CORREL w VBA

Możesz także użyć funkcji CORREL w VBA. Rodzaj:
aplikacja.funkcja arkusza roboczego.correl(tablica1,tablica2)
W przypadku argumentów funkcji (tablica 1 itd.) można wprowadzić je bezpośrednio do funkcji lub zdefiniować zmienne, które będą używane w zamian.

Wróć do listy wszystkich funkcji w Excelu

wave wave wave wave wave