Principal » tranzacționarea algoritmică » Regresie liniară multiplă - Definiție MLR

Regresie liniară multiplă - Definiție MLR

tranzacționarea algoritmică : Regresie liniară multiplă - Definiție MLR
Ce este regresia liniară multiplă - MLR?

Regresia liniară multiplă (MLR), cunoscută și sub denumirea de regresie multiplă, este o tehnică statistică care folosește mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. Scopul regresiei liniare multiple (MLR) este modelarea relației liniare între variabilele explicative (independente) și variabila de răspuns (dependentă).

În esență, regresia multiplă este extinderea regresiei obișnuite a celor mai mici pătrate (OLS) care implică mai mult de o variabilă explicativă.

Formula pentru regresie liniară multiplă este

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵunde, pentru i = n observații: yi = variablexi dependente = variabile expanatoriiβ0 = interceptare y (termen constant) βp = coeficienții de pantă pentru fiecare variabilă explicativă = termenul de eroare al modelului (cunoscut și sub denumirea de reziduuri) \ begin {align} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {unde, pentru} i = n \ textbf {observații:} \\ & y_i = \ text {variabilă dependentă} \\ & x_i = \ text {variabile expanatorii} \\ & \ beta_0 = \ text {y-intercept (constantă termen)} \\ & \ beta_p = \ text {coeficienții de pantă pentru fiecare variabilă explicativă} \\ & \ epsilon = \ text {termenul de eroare al modelului (cunoscut și sub denumirea de reziduuri)} \\ \ end {aliniat} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ unde, pentru i = n observații: yi = variablexi dependente = variabile expanatoriiβ0 = y-interceptare (termen constant) βp = Coeficienții de pantă pentru fiecare variabilă explicativă = termenul de eroare al modelului (cunoscut și sub denumirea de reziduuri)

Explicarea regresiei liniare multiple

O regresie liniară simplă este o funcție care permite unui analist sau statistician să facă predicții despre o variabilă pe baza informațiilor cunoscute despre o altă variabilă. Regresia liniară poate fi utilizată doar atunci când una are două variabile continue: o variabilă independentă și o variabilă dependentă. Variabila independentă este parametrul care este utilizat pentru a calcula variabila sau rezultatul dependent. Un model de regresie multiplă se extinde la mai multe variabile explicative.

Modelul de regresie multiplă se bazează pe următoarele ipoteze:

  • Există o relație liniară între variabilele dependente și variabilele independente.
  • Variabilele independente nu sunt corelate prea mult între ele.
  • y i Observațiile sunt selectate independent și aleatoriu din populație.
  • Reziduurile trebuie distribuite în mod normal cu o medie de 0 și variație σ.

Coeficientul de determinare (pătrat R) este o metrică statistică care este utilizată pentru a măsura cât de mult din variația rezultatului poate fi explicată prin variația variabilelor independente. R2 crește întotdeauna pe măsură ce se adaugă mai mulți predictori la modelul MLR, chiar dacă predictorii nu pot fi legați de variabila rezultat.

Prin urmare, R 2 nu poate fi utilizat pentru a identifica ce predictori ar trebui să fie incluși într-un model și care ar trebui să fie excluși. R 2 poate fi doar între 0 și 1, unde 0 indică faptul că rezultatul nu poate fi prezis de niciuna dintre variabilele independente și 1 indică că rezultatul poate fi prevăzut fără eroare din variabilele independente.

Când se interpretează rezultatele unei regresii multiple, coeficienții beta sunt valabili, menținând constant toate celelalte variabile („toate celelalte egale”). Ieșirea dintr-o regresie multiplă poate fi afișată pe orizontală ca o ecuație sau verticală sub formă de tabel.

Exemplu folosind regresie liniară multiplă

De exemplu, un analist poate dori să știe cum afectează circulația pieței prețul Exxon Mobil (XOM). În acest caz, ecuația sa liniară va avea valoarea indicelui S&P 500 ca variabilă independentă sau predictor și prețul XOM ca variabilă dependentă.

În realitate, există mai mulți factori care prezic rezultatul unui eveniment. De exemplu, mișcarea prețurilor Exxon Mobil depinde mai mult decât de performanța pieței de ansamblu. Alți predictori, cum ar fi prețul petrolului, ratele dobânzilor și mișcarea prețurilor la viitorul petrolului pot afecta prețul XOM și prețul acțiunilor altor companii petroliere. Pentru a înțelege o relație în care sunt prezente mai mult de două variabile, se utilizează o regresie liniară multiplă.

Regresia liniară multiplă (MLR) este utilizată pentru a determina o relație matematică între un număr de variabile aleatorii. În alți termeni, MLR analizează modul în care mai multe variabile independente sunt legate de o singură variabilă dependentă. După ce fiecare dintre factorii independenți a fost determinat să prezică variabila dependentă, informațiile despre multiplele variabile pot fi utilizate pentru a crea o predicție exactă asupra nivelului de efect pe care îl au asupra variabilei de rezultat. Modelul creează o relație sub forma unei linii drepte (liniare) care se apropie cel mai bine de toate punctele de date individuale.

Cu referire la ecuația MLR de mai sus, în exemplul nostru:

  • y i = variabilă dependentă: prețul XOM
  • x i1 = ratele dobânzii
  • x i2 = prețul petrolului
  • x i3 = valoarea indicelui S&P 500
  • x i4 = prețul viitorului petrolului
  • B 0 = interceptarea y la ora zero
  • B 1 = coeficientul de regresie care măsoară o modificare unitară a variabilei dependente atunci când x i1 se modifică - modificarea prețului XOM la modificarea ratelor dobânzii
  • B 2 = valoarea coeficientului care măsoară o modificare unitară a variabilei dependente atunci când se modifică x i2 - modificarea prețului XOM atunci când prețurile petrolului se modifică

Cele mai mici pătrate estimate, B 0, B 1, B 2 ... B p, sunt de obicei calculate prin software statistic. Întrucât multe variabile pot fi incluse în modelul de regresie în care fiecare variabilă independentă este diferențiată cu un număr - 1, 2, 3, 4 ... p. Modelul de regresie multiplă permite unui analist să prezică un rezultat bazat pe informațiile furnizate pe mai multe variabile explicative.

Totuși, modelul nu este întotdeauna perfect exact, deoarece fiecare punct de date poate diferi ușor de rezultatul prevăzut de model. Valoarea reziduală, E, care este diferența dintre rezultatul real și rezultatul prevăzut, este inclusă în model pentru a ține cont de astfel de variații ușoare.

Presupunând că rulăm modelul nostru de regresie a prețurilor XOM printr-un software de calcul statistic, care returnează această ieșire:

Un analist ar interpreta această ieșire ca să însemne dacă alte variabile sunt menținute constant, prețul XOM va crește cu 7, 8% dacă prețul petrolului pe piețe va crește cu 1%. Modelul arată, de asemenea, că prețul XOM va scădea cu 1, 5% în urma creșterii cu 1% a ratelor dobânzii. R 2 indică faptul că 86, 5% din variațiile prețului acțiunii Exxon Mobil pot fi explicate prin modificări ale ratei dobânzii, prețului petrolului, futuresului petrolului și indicelui S&P 500.

Cheie de luat cu cheie

  • Regresia liniară multiplă (MLR), cunoscută și sub denumirea de regresie multiplă, este o tehnică statistică care folosește mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns.
  • Regresia multiplă este o extensie a regresiei liniare (OLS) care folosește doar o variabilă explicativă.
  • MLR este utilizat pe scară largă în economie și inferențe financiare.

Diferența dintre regresia liniară și cea multiplă

Regresia liniară (OLS) compară răspunsul unei variabile dependente, dată fiind o modificare a unei variabile explicative. Cu toate acestea, este rar ca o variabilă dependentă să fie explicată de o singură variabilă. În acest caz, un analist folosește regresia multiplă, care încearcă să explice o variabilă dependentă folosind mai multe variabile independente. Regresii multiple pot fi liniare și neliniare.

Regresii multiple se bazează pe presupunerea că există o relație liniară între variabilele dependente și independente. De asemenea, nu presupune nicio corelație majoră între variabilele independente.

Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.

Termeni înrudiți

Ce măsuri de regresie Regresiunea este o măsurare statistică care încearcă să determine puterea relației dintre o variabilă dependentă (notată de obicei de Y) și o serie de alte variabile care se schimbă (cunoscute sub numele de variabile independente). mai mult Ce este un termen de eroare "> Un termen de eroare este definit ca o variabilă într-un model statistic, care este creat atunci când modelul nu reprezintă pe deplin relația reală între variabilele independente și dependente. Mai mult Cum funcționează metoda celor mai mici pătrate Cel mai puțin Metoda pătratelor este o tehnică statistică pentru a determina linia de cea mai bună potrivire pentru un model, specificată de o ecuație cu anumiți parametri la datele observate. date în scopul testării teoriilor, ipotezelor și tendințelor viitoare. mai mult R-pătrat R-pătrat este o măsură statistică care reprezintă proporția varianței pentru o variabilă dependentă explicată de o variabilă independentă. Mai mult Cum funcționează coeficientul de determinare Coeficientul de determinare este o măsură utilizată în analiza statistică pentru a evalua cât de bine explică un model și prezice rezultatele viitoare Linkuri rtner
Recomandat
Lasă Un Comentariu