Principal » tranzacționarea algoritmică » Coeficient de determinare

Coeficient de determinare

Care este coeficientul de determinare?

Coeficientul de determinare este o măsură utilizată în analiza statistică care evaluează cât de bine explică un model și prezice rezultatele viitoare. Este indicativ al nivelului de variabilitate explicat în setul de date. Coeficientul de determinare, cunoscut și sub denumirea de "R-pătrat", este utilizat ca ghid pentru a măsura exactitatea modelului.

Un mod de interpretare a acestei cifre este de a spune că variabilele incluse într-un model dat explică aproximativ x% din variația observată. Deci, dacă R2 = 0, 50, atunci aproximativ jumătate din variația observată poate fi explicată de model.

01:58

R-Squared

Cheie de luat cu cheie

Coeficientul de determinare este o idee complexă centrată pe analiza statistică a unui model viitor de date.
Coeficientul de determinare este utilizat pentru a explica câtă variabilitate a unui factor poate fi cauzată de relația sa cu un alt factor.

Înțelegerea coeficientului de determinare

Coeficientul de determinare este utilizat pentru a explica câtă variabilitate a unui factor poate fi cauzată de relația sa cu un alt factor. Se bazează foarte mult pe analiza tendințelor și este reprezentată ca o valoare între 0 și 1.

Cu cât valoarea este mai aproape de 1, cu atât este mai bună potrivirea sau relația dintre cei doi factori. Coeficientul de determinare este pătratul coeficientului de corelație, cunoscut și sub denumirea de "R", care îi permite să afișeze gradul de corelație liniară între două variabile.

Această corelație este cunoscută sub numele de „bunătatea potrivirii”. O valoare de 1, 0 indică o potrivire perfectă, fiind astfel un model foarte fiabil pentru prognozele viitoare, ceea ce indică faptul că modelul explică toate variațiile observate. Pe de altă parte, o valoare 0 ar indica faptul că modelul nu reușește să modeleze cu exactitate datele. Pentru un model cu mai multe variabile, cum ar fi un model de regresie multiplă, R2 ajustat este un coeficient de determinare mai bun. În economie, o valoare R ² peste 0, 60 este considerată utilă.

Avantajele analizei coeficientului de determinare

Coeficientul de determinare este pătratul corelației dintre scorurile preconizate într-un set de date versus setul real de scoruri. Poate fi, de asemenea, exprimat ca pătratul corelației dintre scorurile X și Y, X fiind variabila independentă și Y fiind variabila dependentă.

Indiferent de reprezentare, un R-pătrat egal cu 0 înseamnă că variabila dependentă nu poate fi prevăzută folosind variabila independentă. În schimb, dacă este egal cu 1, înseamnă că dependenta unei variabile este întotdeauna prezisă de variabila independentă.

Un coeficient de determinare care se încadrează în acest interval măsoară măsura în care variabila dependentă este prevăzută de variabila independentă. Un pătrat R de 0, 20, de exemplu, înseamnă că 20% din variabila dependentă este prevăzută de variabila independentă.

Bunătatea de potrivire sau gradul de corelație liniară măsoară distanța dintre o linie montată pe un grafic și toate punctele de date care sunt împrăștiate în grafic. Setul strâns de date va avea o linie de regresie care este foarte aproape de puncte și va avea un nivel ridicat de potrivire, ceea ce înseamnă că distanța dintre linie și date este foarte mică. O potrivire bună are un pătrat R care este aproape de 1.

Cu toate acestea, R-squared nu este în măsură să stabilească dacă punctele de date sau predicțiile sunt părtinitoare. De asemenea, nu spune analistului sau utilizatorului dacă coeficientul de determinare este bun sau nu. Un pătrat R redus nu este rău, de exemplu, depinde de persoană să ia o decizie pe baza numărului R-pătrat.

Coeficientul de determinare nu trebuie interpretat naiv. De exemplu, dacă raportul R-pătrat al unui model este raportat la 75%, variația erorilor sale este cu 75% mai mică decât variația variabilei dependente, iar abaterea standard a erorilor sale este cu 50% mai mică decât abaterea standard a dependentului variabil. Abaterea standard a erorilor modelului este de aproximativ o treime din dimensiunea abaterii standard a erorilor pe care le-ați obține cu un model cu doar constant.

În cele din urmă, chiar dacă o valoare pătrată R este mare, nu poate exista o semnificație statistică a variabilelor explicative dintr-un model sau dimensiunea efectivă a acestor variabile poate fi foarte mică în termeni practice.

Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.

Termeni înrudiți

Ce este o durată de eroare? Un termen de eroare este definit ca o variabilă într-un model statistic, care este creat atunci când modelul nu reprezintă pe deplin relația reală între variabilele independente și dependente. mai mult Cum funcționează regresia liniară multiplă Regresia liniară multiplă (MLR) este o tehnică statistică care folosește mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. mai mult Line of Best Fit Linia de cea mai bună potrivire este o ieșire a analizei de regresie care reprezintă relația dintre două sau mai multe variabile dintr-un set de date. mai mult R-pătrat R-pătrat este o măsură statistică care reprezintă proporția variației pentru o variabilă dependentă explicată de o variabilă independentă. mai mult Cum funcționează metoda celor mai mici pătrate Metoda celor mai mici pătrate este o tehnică statistică pentru a determina linia cea mai potrivită pentru un model, specificată de o ecuație cu anumiți parametri pentru datele observate. mai mult Heteroskedasticitate În statistici, heteroskedasticitatea se întâmplă atunci când abaterile standard ale unei variabile, monitorizate într-un anumit interval de timp, sunt neconstante. mai multe link-uri partenere

← Cum funcționează Blockchain?

Obligație cu reducere profundă →

Recomandat

Lasă Un Comentariu