Principal » tranzacționarea algoritmică » Bazele regresiei pentru analiza afacerilor

Bazele regresiei pentru analiza afacerilor

tranzacționarea algoritmică : Bazele regresiei pentru analiza afacerilor

Dacă v-ați întrebat vreodată cum se raportează două sau mai multe date între ele (de exemplu, modul în care PIB-ul este afectat de modificările șomajului și inflației) sau dacă ați avut vreodată șeful dumneavoastră, vă rugăm să creați o prognoză sau să analizați predicțiile bazate pe pe relațiile dintre variabile, atunci învățarea analizei de regresie ar merita bine timpul tău.

În acest articol, veți afla elementele de bază ale regresiei liniare simple, uneori numite „ordinare a celor mai mici pătrate” sau a regresiei OLS - un instrument utilizat frecvent în prognoză și analiza financiară. Vom începe prin a învăța principiile de bază ale regresiei, mai întâi aflând despre covarianță și corelație, apoi vom trece la construirea și interpretarea unei ieșiri de regresie. Cele mai populare programe de afaceri, cum ar fi Microsoft Excel, pot face toate calculele și rezultatele de regresie pentru dvs., dar este încă important să învățați mecanica de bază.

variabile

În centrul unui model de regresie se află relația dintre două variabile diferite, numite variabile dependente și independente. De exemplu, să presupunem că doriți să previzionați vânzările pentru compania dvs. și ați ajuns la concluzia că vânzările companiei dvs. cresc și scad în funcție de modificările din PIB.

Vânzările pe care le preconizați ar fi variabila dependentă, deoarece valoarea lor „depinde” de valoarea PIB, iar PIB-ul ar fi variabila independentă. Apoi, va trebui să determinați puterea relației dintre aceste două variabile pentru a prognoza vânzările. Dacă PIB-ul crește / scade cu 1%, cât vor crește sau vor scădea vânzările?

covarianţă

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {aliniat} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {aliniat} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Formula pentru calcularea relației dintre două variabile se numește covarianță. Acest calcul vă arată direcția relației. Dacă o variabilă crește și cealaltă variabilă tinde să crească, covarianța ar fi pozitivă. Dacă o variabilă urcă și cealaltă tinde să scadă, atunci covarianța ar fi negativă.

Numărul real pe care îl obțineți din calcularea acestui lucru poate fi greu de interpretat, deoarece nu este standardizat. O covarianță de cinci, de exemplu, poate fi interpretată ca o relație pozitivă, dar puterea relației se poate spune că este mai puternică decât dacă numărul ar fi patru sau mai slab decât dacă numărul ar fi fost șase.

Coeficient de corelație

Corelare = ρxy = Covxysxsy \ begin {align} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {aliniat} Corelație = ρxy = sx sy Covxy

Trebuie să standardizăm covarianța pentru a ne permite să o interpretăm și să o utilizăm mai bine în prognoză, iar rezultatul este calculul corelației. Calculul corelației ia pur și simplu covarianța și o împarte după produsul abaterii standard a celor două variabile. Aceasta va lega corelația dintre o valoare de -1 și +1.

O corelație de +1 poate fi interpretată pentru a sugera că ambele variabile se mișcă perfect pozitiv între ele și o -1 implică că sunt perfect corelate negativ. În exemplul nostru anterior, dacă corelația este +1 și PIB-ul crește cu 1%, vânzările ar crește cu 1%. Dacă corelația este -1, o creștere a PIB de 1% ar duce la o scădere a vânzărilor de 1% - exact exact invers.

Ecuația de regresie

Acum că știm cum este calculată relația relativă între cele două variabile, putem dezvolta o ecuație de regresie pentru a previziona sau a prezice variabila dorită. Mai jos este formula pentru o regresie liniară simplă. „Y” este valoarea pe care încercăm să o prognozăm, „b” este panta liniei de regresie, „x” este valoarea valorii noastre independente, iar „a” reprezintă interceptarea y. Ecuația de regresie descrie pur și simplu relația dintre variabila dependentă (y) și variabila independentă (x).

y = bx + a \ begin {aliniat} & y = bx + a \\ \ end {aliniat} y = bx + a

Intercepția, sau „a”, este valoarea lui y (variabilă dependentă) dacă valoarea lui x (variabilă independentă) este zero, și astfel se numește uneori pur și simplu „constanta”. Deci, dacă nu ar exista nicio schimbare în PIB, compania dvs. ar face în continuare anumite vânzări - această valoare, atunci când modificarea PIB-ului este zero, este interceptarea. Aruncați o privire la graficul de mai jos pentru a vedea o reprezentare grafică a unei ecuații de regresie. În acest grafic, există doar cinci puncte de date reprezentate de cele cinci puncte din grafic. Regresia liniară încearcă să estimeze o linie care se potrivește cel mai bine datelor (o linie de cea mai bună potrivire), iar ecuația acelei linii are ca rezultat ecuația de regresie.

Figura 1: Linia cea mai potrivită

Sursa: Investopedia

Regresii în Excel

Acum că înțelegeți o parte din fundalul care intră într-o analiză de regresie, să facem un exemplu simplu folosind instrumentele de regresie Excel. Ne vom baza pe exemplul anterior de a încerca să prognozăm vânzările de anul viitor pe baza schimbărilor în PIB. Următorul tabel prezintă câteva puncte de date artificiale, dar aceste numere pot fi ușor accesibile în viața reală.

AnVânzăriPIB
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Doar cu ochii în tabel, puteți vedea că va exista o corelație pozitivă între vânzări și PIB. Ambele tind să meargă împreună. Folosind Excel, tot ce trebuie să faceți este să faceți clic pe meniul derulant Instrumente, să selectați Analiza datelor și de acolo să alegeți Regresie . Caseta pop-up este ușor de completat de acolo; Intervalul dvs. de intrare Y este coloana dvs. „Vânzări”, iar intervalul dvs. de intrare X este modificarea coloanei PIB; alegeți intervalul de ieșire pentru locul în care doriți să apară datele din foaia de calcul și apăsați OK. Ar trebui să vedeți ceva similar cu ceea ce este prezentat în tabelul de mai jos:

Coeficienții statisticilor de regresie

R multiplu0.8292243Intercepta34.58409

Piața R


0.687613PIB88.15552
Ajustat
Piața R


0.583484

-


-


Eroare standard51.021807-

-


observaţii5

-


-


Interpretare

Rezultatele majore de care trebuie să vă preocupați pentru regresia liniară simplă sunt pătratul R, interceptarea (constantă) și coeficientul beta (b) al PIB. Numărul pătrat R din acest exemplu este de 68, 7% - acest lucru arată cât de bine modelul nostru prezice sau prognozează vânzările viitoare, ceea ce sugerează că variabilele explicative ale modelului au prezis 68, 7% din variația variabilei dependente. În continuare, avem un intercept de 34.58, care ne spune că, dacă se presupune că schimbarea PIB-ului va fi zero, vânzările noastre ar fi de aproximativ 35 de unități. Și în final, PIB-ul sau coeficientul de corelație de 88, 15 ne spune că, dacă PIB-ul va crește cu 1%, vânzările vor crește probabil cu aproximativ 88 de unități.

Linia de jos

Deci, cum ați folosi acest model simplu în afacerea dvs. ">

Desigur, aceasta este doar o regresie simplă și există modele pe care le puteți construi care folosesc mai multe variabile independente numite regresii liniare multiple. Dar regresiile multiple liniare sunt mai complicate și au mai multe probleme care ar avea nevoie de un alt articol pentru a discuta.

Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.
Recomandat
Lasă Un Comentariu