overfitting

tranzacționarea algoritmică : overfitting
Ce este excesiv?

Suprafocarea este o eroare de modelare care apare atunci când o funcție este prea potrivită unui set limitat de puncte de date. Suprasolicitarea modelului ia, în general, forma unui model excesiv de complex pentru a explica idiosincraziile din datele studiate.

În realitate, datele studiate adesea au un anumit grad de eroare sau zgomot aleatoriu. Astfel, încercarea de a face modelul să se conformeze prea strâns cu datele ușor inexacte poate infecta modelul cu erori substanțiale și poate reduce puterea sa de predicție.

[Important: Profesioniștii financiari trebuie să fie întotdeauna conștienți de pericolele de a se potrivi cu un model bazat pe date limitate.]

Înțelegerea Suprapunerii

De exemplu, o problemă comună este folosirea algoritmilor de calculator pentru a căuta în baze de date extinse de date istorice ale pieței, pentru a găsi modele. Având în vedere suficient studiu, este adesea posibil să se elaboreze teoreme elaborate care par să prezice lucruri precum retururile pe piața bursieră cu o precizie apropiată.

Cu toate acestea, atunci când sunt aplicate la datele din afara eșantionului, astfel de teoreme s-ar putea dovedi a fi doar o adaptare a unui model la ceea ce în realitate erau doar întâmplări întâmplătoare. În toate cazurile, este important să testați un model pe baza datelor care nu se află în eșantionul utilizat pentru a-l dezvolta.

Cheie de luat cu cheie

  • Suprafocarea este o eroare de modelare care apare atunci când o funcție este prea potrivită unui set limitat de puncte de date.
  • Profesioniștii financiari trebuie să fie întotdeauna conștienți de pericolele de a se potrivi cu un model bazat pe date limitate.
Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.

Termeni înrudiți

De ce contează semnificația statistică Semnificația statistică se referă la un rezultat care nu este probabil să apară la întâmplare, ci mai degrabă este probabil să fie atribuit unei anumite cauze. mai mult Cum funcționează netezirea datelor Netezirea datelor se face prin utilizarea unui algoritm pentru a elimina zgomotul dintr-un set de date. Acest lucru permite modelele importante să iasă în evidență. Netezirea datelor poate fi folosită pentru a ajuta la prezicerea tendințelor, cum ar fi cele care se găsesc în prețurile titlurilor. mai multe Eșantion Un eșantion este o versiune mai mică și ușor de gestionat a unui grup mai mare. Probele sunt utilizate în testarea statistică atunci când dimensiunile populației sunt prea mari. mai mult Heteroskedasticitate În statistici, heteroskedasticitatea se întâmplă atunci când abaterile standard ale unei variabile, monitorizate într-un anumit interval de timp, sunt neconstante. mai mult Citirea în eșantionarea aleatorie stratificată Eșantionarea randomizată stratificată este o metodă de eșantionare care implică divizarea unei populații în grupuri mai mici cunoscute sub numele de straturi. mai mult Cum funcționează probe aleatorii simple Un eșantion simplu aleatoriu este un subset al unei populații statistice în care fiecare membru al subsetului are o probabilitate egală de a fi ales. Un eșantion simplu aleatoriu este menit să fie o reprezentare imparțială a unui grup. mai multe link-uri partenere
Recomandat
Lasă Un Comentariu