Regresijos tiesės nuolydis ir koreliacijos koeficientas

Daug kartų tyrinėjo statistika svarbu užmegzti ryšius tarp skirtingų temų. Pamatysime pavyzdį, kuriame regresijos linijos nuolydis yra tiesiogiai susijęs su koreliacijos koeficientas. Kadangi abi sąvokos apima tiesias linijas, natūralu užduoti klausimą: "Kaip yra koreliacijos koeficientas ir mažiausia kvadratinė linija susijęs?"

Pirmiausia apžvelgsime kai kurias šių abiejų temų aplinkybes.

Išsami informacija apie koreliaciją

Svarbu atsiminti detales, susijusias su koreliacijos koeficientu, kuris žymimas r. Ši statistika naudojama, kai susiejome kiekybiniai duomenys. Iš išsklaidytos teritorijos suporuoti duomenys, galime ieškoti bendro duomenų paskirstymo tendencijų. Kai kurie suporuoti duomenys rodo linijinį arba tiesinį modelį. Tačiau praktiškai duomenys niekada nesutampa tiesia linija.

Keli žmonės, žiūrintys į tą patį išsklaidyti iš suporuotų duomenų nesutiktų, ar artima bendra linijinė tendencija. Galų gale, mūsų kriterijai tai gali būti šiek tiek subjektyvūs. Mūsų naudojama skalė taip pat gali paveikti mūsų suvokimą apie duomenis. Dėl šių ir dar daugiau priežasčių mums reikalinga tam tikra objektyvi priemonė, kuri parodytų, kaip artimi mūsų suporuoti duomenys yra tiesiniai. Koreliacijos koeficientas mums to pasiekia.

instagram viewer

Keletas pagrindinių faktų apie r apima:

  • Vertė r svyruoja tarp bet kurio realaus skaičiaus nuo -1 iki 1.
  • Vertės r artimas 0 reiškia, kad tarp duomenų yra mažai ar net linijinis ryšys.
  • Vertės r artimas 1 reiškia, kad tarp duomenų yra teigiamas tiesinis ryšys. Tai reiškia, kad kaip x padidina tai y taip pat padidėja.
  • Vertės r artimas -1 reiškia, kad tarp duomenų yra neigiamas tiesinis ryšys. Tai reiškia, kad kaip x padidina tai y mažėja.

Mažiausių kvadratų linijos nuolydis

Paskutiniai du aukščiau esančio sąrašo elementai nukreipia mus į mažiausiai kvadratų liniją, kuri geriausiai tinka. Prisiminkite, kad linijos nuolydis matuoja, kiek vienetų ji eina aukštyn ar žemyn kiekvienam vienetui, kurį judame į dešinę. Kartais tai nurodoma kaip linijos pakilimas iš padalijimo arba pokytis y vertės dalijamos iš x vertybes.

Apskritai tiesių linijų nuolydis yra teigiamas, neigiamas arba lygus nuliui. Jei mes ištirtume mažiausias kvadratines regresijos linijas ir palygintume atitinkamas r, pastebėtume, kad kiekvieną kartą mūsų duomenys turi neigiamas koreliacijos koeficientas, regresijos tiesės nuolydis yra neigiamas. Panašiai, kiekvieną kartą, kai turime teigiamą koreliacijos koeficientą, regresijos tiesės nuolydis yra teigiamas.

Iš šio pastebėjimo turėtų būti akivaizdu, kad koreliacijos koeficiento ženklas ir mažiausių kvadratų tiesės nuolydis yra tikrai susiję. Belieka paaiškinti, kodėl tai tiesa.

Šlaito formulė

Priežastis ryšiui tarp vertės r ir mažiausių kvadratų linijos nuolydis susijęs su formule, kuri suteikia mums šios linijos nuolydį. Dėl suporuotų duomenų (x, y) mes žymime standartinis nuokrypisx duomenis pateikė sx ir standartinis nuokrypis y duomenis pateikė sy.

Nuolydžio formulė a regresijos tiesė yra:

  • a = r (sy/ sx)

Norint apskaičiuoti standartinį nuokrypį, reikia paimti neigiamos skaičiaus teigiamą kvadratinę šaknį. Dėl to abu standartiniai nuolydžio formulės nuokrypiai turi būti neigiami. Jei darysime prielaidą, kad mūsų duomenys šiek tiek skiriasi, mes negalėsime atmesti galimybės, kad kuris nors iš šių standartinių nuokrypių yra lygus nuliui. Taigi koreliacijos koeficientas bus toks pat kaip regresijos tiesės nuolydžio ženklas.