Coeficient de determinare
Care este coeficientul de determinare?Coeficientul de determinare este o măsură utilizată în analiza statistică care evaluează cât de bine explică un model și prezice rezultatele viitoare. Este indicativ al nivelului de variabilitate explicat în setul de date. Coeficientul de determinare, cunoscut și sub denumirea de "R-pătrat", este utilizat ca ghid pentru a măsura exactitatea modelului.
Un mod de interpretare a acestei cifre este de a spune că variabilele incluse într-un model dat explică aproximativ x% din variația observată. Deci, dacă R2 = 0, 50, atunci aproximativ jumătate din variația observată poate fi explicată de model.
01:58R-Squared
Cheie de luat cu cheie
- Coeficientul de determinare este o idee complexă centrată pe analiza statistică a unui model viitor de date.
- Coeficientul de determinare este utilizat pentru a explica câtă variabilitate a unui factor poate fi cauzată de relația sa cu un alt factor.
Înțelegerea coeficientului de determinare
Coeficientul de determinare este utilizat pentru a explica câtă variabilitate a unui factor poate fi cauzată de relația sa cu un alt factor. Se bazează foarte mult pe analiza tendințelor și este reprezentată ca o valoare între 0 și 1.
Cu cât valoarea este mai aproape de 1, cu atât este mai bună potrivirea sau relația dintre cei doi factori. Coeficientul de determinare este pătratul coeficientului de corelație, cunoscut și sub denumirea de "R", care îi permite să afișeze gradul de corelație liniară între două variabile.
Această corelație este cunoscută sub numele de „bunătatea potrivirii”. O valoare de 1, 0 indică o potrivire perfectă, fiind astfel un model foarte fiabil pentru prognozele viitoare, ceea ce indică faptul că modelul explică toate variațiile observate. Pe de altă parte, o valoare 0 ar indica faptul că modelul nu reușește să modeleze cu exactitate datele. Pentru un model cu mai multe variabile, cum ar fi un model de regresie multiplă, R2 ajustat este un coeficient de determinare mai bun. În economie, o valoare R 2 peste 0, 60 este considerată utilă.
Avantajele analizei coeficientului de determinare
Coeficientul de determinare este pătratul corelației dintre scorurile preconizate într-un set de date versus setul real de scoruri. Poate fi, de asemenea, exprimat ca pătratul corelației dintre scorurile X și Y, X fiind variabila independentă și Y fiind variabila dependentă.
Indiferent de reprezentare, un R-pătrat egal cu 0 înseamnă că variabila dependentă nu poate fi prevăzută folosind variabila independentă. În schimb, dacă este egal cu 1, înseamnă că dependenta unei variabile este întotdeauna prezisă de variabila independentă.
Un coeficient de determinare care se încadrează în acest interval măsoară măsura în care variabila dependentă este prevăzută de variabila independentă. Un pătrat R de 0, 20, de exemplu, înseamnă că 20% din variabila dependentă este prevăzută de variabila independentă.
Bunătatea de potrivire sau gradul de corelație liniară măsoară distanța dintre o linie montată pe un grafic și toate punctele de date care sunt împrăștiate în grafic. Setul strâns de date va avea o linie de regresie care este foarte aproape de puncte și va avea un nivel ridicat de potrivire, ceea ce înseamnă că distanța dintre linie și date este foarte mică. O potrivire bună are un pătrat R care este aproape de 1.
Cu toate acestea, R-squared nu este în măsură să stabilească dacă punctele de date sau predicțiile sunt părtinitoare. De asemenea, nu spune analistului sau utilizatorului dacă coeficientul de determinare este bun sau nu. Un pătrat R redus nu este rău, de exemplu, depinde de persoană să ia o decizie pe baza numărului R-pătrat.
Coeficientul de determinare nu trebuie interpretat naiv. De exemplu, dacă raportul R-pătrat al unui model este raportat la 75%, variația erorilor sale este cu 75% mai mică decât variația variabilei dependente, iar abaterea standard a erorilor sale este cu 50% mai mică decât abaterea standard a dependentului variabil. Abaterea standard a erorilor modelului este de aproximativ o treime din dimensiunea abaterii standard a erorilor pe care le-ați obține cu un model cu doar constant.
În cele din urmă, chiar dacă o valoare pătrată R este mare, nu poate exista o semnificație statistică a variabilelor explicative dintr-un model sau dimensiunea efectivă a acestor variabile poate fi foarte mică în termeni practice.
Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.