Korrelatsioon

Mis on korrelatsioon:

Korrelatsioon tähendab sarnasust või seost kahe asja, inimeste või ideede vahel . See on sarnasus või samaväärsus, mis esineb kahe erineva hüpoteesi, olukorra või objekti vahel.

Statistika ja matemaatika valdkonnas viitab korrelatsioon kahe või enama seotud muutuja vahele.

Termin "korrelatsioon" on naiselik nimisõna, mis pärineb ladina korrelatsioonist.

Sõna korrelatsiooni võib asendada sünonüümidega, nagu näiteks: seos, võrrand, seos, kirjavahetus, analoogia ja ühendus.

Vastavustegur

Statistikas mõõdab Pearsoni korrelatsioonikoefitsient (r), mida nimetatakse ka toote-momendi korrelatsioonikoefitsiendiks, kahe muutuja vahelist suhet samas metrilises skaalal.

Korrelatsioonikoefitsiendi funktsiooniks on teadaolevate andmekogumite vahelise suhte intensiivsuse määramine.

Korrelatsioonikoefitsiendi väärtus võib varieeruda vahemikus -1 ja 1 ning saadud tulemus määrab, kas korrelatsioon on negatiivne või positiivne.

Koefitsiendi tõlgendamiseks on vaja teada, et 1 tähendab, et muutujate vaheline korrelatsioon on täiuslik positiivne ja -1 tähendab, et see on täiuslik negatiivne . Kui koefitsient on 0, tähendab see, et muutujad ei sõltu üksteisest.

Statistikas on olemas ka Spearmani korrelatsioonikoefitsient, mis kannab seda nime statistiku Charles Spearmani auks. Selle koefitsiendi funktsiooniks on kahe muutuja vahelise suhte intensiivsuse mõõtmine olenemata sellest, kas need on lineaarsed või mitte.

Spearmani korrelatsioon aitab hinnata, kas kahe analüüsitava muutuja vahelise suhte intensiivsust saab mõõta monotoonse funktsiooniga (matemaatiline funktsioon, mis säilitab või inverteerib esialgse järjekorra suhte).

Pearsoni korrelatsioonikoefitsiendi arvutamine

Meetod 1) Pearsoni korrelatsioonikoefitsiendi arvutamine, kasutades kovarianti ja standardhälvet.

Kus

S _XY on kovarianss;

S _x ja S _y esindavad vastavalt muutujate x ja y standardhälvet.

Sellisel juhul hõlmab arvutus kõigepealt muutujate vahelise kovariansi leidmist ja nende iga standardhälvet. Seejärel jagatakse kovarianss standardhälvete korrutamisega.

Sageli annab avaldus juba muutujate standardhälbed või nende vahelise kovariandi, kasutades lihtsalt valemit.

2. meetod) Pearsoni korrelatsioonikoefitsiendi arvutamine toorandmetega (ilma kovariantsuseta või standardhälbe).

Selle meetodiga on kõige otsesem valem järgmine:

Näiteks eeldades, et meil on andmeid kahe muutujaga n = 6 tähelepanekutega: glükoosi tase (y) ja vanus (x), järgib arvutus järgmisi samme:

1. etapp: koostage tabel olemasolevate andmetega: i, x, y ja lisage tühjad veerud xy, x² ja y² jaoks:

Samm 2: korruta x ja y, et täita veerg "xy". Näiteks reas 1 on meil: x1y1 = 43 × 99 = 4257.

3. samm: Tõstke veeru x väärtused üles ja registreerige tulemused veerusse x². Näiteks esimesel real on meil x ₁ 2 = 43 × 43 = 1849.

Samm 4: tehke sama, mis etapis 3, kasutades nüüd y veergu ja salvestage oma väärtuste ruut veerus y². Näiteks esimeses reas on meil: y ₁ 2 = 99 × 99 = 9801.

5. etapp: saada kõigi veerude numbri summa ja asetage tulemus veergu. Näiteks vanuse X veeru summa on 43 + 21 + 25 + 42 + 57 + 59 = 247.

6. samm: korrelatsioonikoefitsiendi saamiseks kasutage ülaltoodud valemit:

Seega on meil:

Spearmani korrelatsioonikoefitsient

Spearmani korrelatsioonikoefitsiendi arvutamine on mõnevõrra erinev. Selleks peame korraldama oma andmed järgmises tabelis:

1. Olles tutvustanud kahte andmepari, peame need tabelisse lisama. Näiteks:

2. Veerus "A-järjestus" klassifitseerime järjestuses "Kuupäev A" olevad vaatlused kasvaval viisil, kusjuures "1" on veeru madalaim väärtus, en (vaatluste koguarv), kõrgeim väärtus veerus "Kuupäev A" ". Meie näites on:

3. Me teeme sama, et saada veerg "Edetabel B", kasutades nüüd veerus "Andmed B" toodud tähelepanekuid:

4. Veerus "d" panime kahe reitingu (A - B) vahe. Siin ei ole signaal oluline.

5. Tõstke kõik väärtused veerus "d" ja salvestage veerus d²:

6. Lisage kõik andmed veerust "d²". See väärtus on Σd². Meie näites Σd² = 0 + 1 + 0 + 1 = 2

7. Nüüd kasutame Spearmani valemit:

Meie puhul on n võrdne 4-ga, kui vaatame andmete rida (mis vastab vaatluste arvule).

8. Lõpuks asendame eelmise valemi andmed:

Lineaarne regressioon

Lineaarne regressioon on valem, mida kasutatakse muutuja (y) võimaliku väärtuse hindamiseks, kui teiste muutujate (x) väärtused on teada. "X" väärtus on sõltumatu või selgitav muutuja ja "y" on sõltuv muutuja või vastus.

Lineaarset regressiooni kasutatakse selleks, et kontrollida, kuidas "y" väärtus varieerub muutuja "x" funktsioonina. Variatsioonikontrolli väärtusi sisaldavat rida nimetatakse lineaarseks regressiooniks.

Kui selgitav muutuja "x" omab ühte väärtust, nimetatakse regressiooni lihtsaks lineaarseks regressiooniks .