Aplikácia metódy najmenších štvorcov. Aproximácia experimentálnych údajov. Metóda najmenších štvorcov

Metóda najmenších štvorcov používa sa na odhad parametrov regresnej rovnice.
Počet riadkov (zdrojové údaje)

Jednou z metód na štúdium stochastických vzťahov medzi charakteristikami je regresná analýza.
Regresná analýza je odvodením regresnej rovnice, pomocou ktorej sa zistí priemerná hodnota náhodnej premennej (výsledkový atribút), ak je známa hodnota inej (alebo iných) premenných (faktorových atribútov). Zahŕňa nasledujúce kroky:

  1. výber formy spojenia (typ analytickej regresnej rovnice);
  2. odhad parametrov rovnice;
  3. hodnotenie kvality analytickej regresnej rovnice.
Najčastejšie sa na popis štatistického vzťahu znakov používa lineárna forma. Zameranie na lineárne vzťahy sa vysvetľuje jasnou ekonomickou interpretáciou jeho parametrov, obmedzenými variáciami premenných a skutočnosťou, že vo väčšine prípadov sa nelineárne formy vzťahov prevádzajú (logaritmovaním alebo substitúciou premenných) na lineárnu formu, aby sa mohli vykonávať výpočty. .
V prípade lineárneho párového vzťahu bude mať regresná rovnica tvar: y i =a+b·x i +u i. Parametre a a b tejto rovnice sú odhadnuté zo štatistických pozorovacích údajov x a y. Výsledkom takéhoto hodnotenia je rovnica: , kde , sú odhady parametrov a a b, je hodnota výsledného atribútu (premennej) získaná z regresnej rovnice (vypočítaná hodnota).

Najčastejšie sa používa na odhad parametrov metóda najmenších štvorcov (LSM).
Metóda najmenších štvorcov poskytuje najlepšie (konzistentné, efektívne a nezaujaté) odhady parametrov regresnej rovnice. Ale iba ak sú splnené určité predpoklady týkajúce sa náhodného člena (u) a nezávislej premennej (x) (pozri predpoklady OLS).

Problém odhadu parametrov lineárnej párovej rovnice metódou najmenších štvorcov je nasledovné: získať také odhady parametrov , , pri ktorých je súčet kvadrátov odchýlok skutočných hodnôt výslednej charakteristiky - y i od vypočítaných hodnôt - minimálny.
Formálne OLS test dá sa napísať takto: .

Klasifikácia metód najmenších štvorcov

  1. Metóda najmenších štvorcov.
  2. Metóda maximálnej pravdepodobnosti (pre normálny klasický lineárny regresný model sa postuluje normalita regresných zvyškov).
  3. Zovšeobecnená metóda najmenších štvorcov OLS sa používa v prípade autokorelácie chýb a v prípade heteroskedasticity.
  4. Metóda vážených najmenších štvorcov (špeciálny prípad OLS s heteroskedastickými rezíduami).

Ilustrujme pointu klasická metóda najmenších štvorcov graficky. Aby sme to dosiahli, zostrojíme bodový graf na základe pozorovacích údajov (x i, y i, i=1;n) v pravouhlom súradnicovom systéme (takýto bodový graf sa nazýva korelačné pole). Skúsme vybrať priamku, ktorá je najbližšie k bodom korelačného poľa. Podľa metódy najmenších štvorcov sa čiara vyberá tak, aby súčet druhých mocnín vertikálnych vzdialeností medzi bodmi korelačného poľa a touto čiarou bol minimálny.

Matematická notácia pre tento problém: .
Hodnoty y i a x i = 1...n sú nám známe; Vo funkcii S predstavujú konštanty. Premenné v tejto funkcii sú požadované odhady parametrov - , . Na nájdenie minima funkcie dvoch premenných je potrebné vypočítať parciálne derivácie tejto funkcie pre každý z parametrov a prirovnať ich k nule, t.j. .
Výsledkom je systém 2 normálnych lineárnych rovníc:
Pri riešení tohto systému nájdeme požadované odhady parametrov:

Správnosť výpočtu parametrov regresnej rovnice je možné skontrolovať porovnaním súm (môže dôjsť k určitej nezrovnalosti v dôsledku zaokrúhľovania výpočtov).
Ak chcete vypočítať odhady parametrov, môžete zostaviť tabuľku 1.
Znamienko regresného koeficientu b udáva smer vzťahu (ak b >0, vzťah je priamy, ak b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formálne je hodnota parametra a priemerná hodnota y, pričom x sa rovná nule. Ak atribút-faktor nemá a nemôže mať nulovú hodnotu, potom vyššie uvedená interpretácia parametra a nedáva zmysel.

Posúdenie blízkosti vzťahu medzi charakteristikami realizované pomocou lineárneho párového korelačného koeficientu - r x,y. Dá sa vypočítať pomocou vzorca: . Okrem toho je možné korelačný koeficient lineárnych párov určiť pomocou regresného koeficientu b: .
Rozsah prijateľných hodnôt koeficientu lineárnej párovej korelácie je od –1 do +1. Znamienko korelačného koeficientu udáva smer vzťahu. Ak r x, y > 0, potom je spojenie priame; ak r x, y<0, то связь обратная.
Ak sa tento koeficient blíži k jednotke, potom vzťah medzi charakteristikami možno interpretovať ako pomerne blízky lineárny. Ak sa jeho modul rovná jednej ê r x , y ê =1, potom je vzťah medzi charakteristikami funkčne lineárny. Ak sú znaky x a y lineárne nezávislé, potom r x, y je blízko 0.
Na výpočet r x,y môžete použiť aj tabuľku 1.

stôl 1

N pozorovaníx iy ix i ∙y i
1 x 1y 1x 1 r 1
2 x 2y 2x 2 roky 2
...
nx ny nx n ·y n
Súčet podľa stĺpca∑x∑y∑xy
Priemerná hodnota
Na posúdenie kvality výslednej regresnej rovnice vypočítajte teoretický koeficient determinácie - R 2 yx:

,
kde d2 je rozptyl y vysvetlený regresnou rovnicou;
e 2 - zvyškový (nevysvetlený regresnou rovnicou) rozptyl y;
s 2 y - celkový (celkový) rozptyl y.
Koeficient determinácie charakterizuje podiel variácie (disperzie) výsledného atribútu y vysvetleného regresiou (a následne faktorom x) na celkovej variácii (disperzii) y. Koeficient determinácie R 2 yx nadobúda hodnoty od 0 do 1. Hodnota 1-R 2 yx teda charakterizuje podiel rozptylu y spôsobený vplyvom iných faktorov nezohľadnených v modeli a špecifikačných chýb.
Pri párovej lineárnej regresii je R 2 yx = r 2 yx.

Metóda najmenších štvorcov je matematický postup na zostavenie lineárnej rovnice, ktorá najlepšie vyhovuje množine usporiadaných párov nájdením hodnôt a a b, koeficientov v rovnici priamky. Cieľom najmenších štvorcov je minimalizovať celkovú štvorcovú chybu medzi hodnotami y a ŷ. Ak pre každý bod určíme chybu ŷ, metóda najmenších štvorcov minimalizuje:

kde n = počet usporiadaných párov okolo čiary. čo najbližšie k údajom.

Tento koncept je znázornený na obrázku

Na základe obrázku čiara, ktorá najlepšie zodpovedá údajom, regresná čiara, minimalizuje celkovú druhú druhú chybu štyroch bodov v grafe. Na nasledujúcom príklade vám ukážem, ako to určiť pomocou najmenších štvorcov.

Predstavte si mladý pár, ktorý sa nedávno nasťahoval k sebe a zdieľajú kozmetický stolík v kúpeľni. Mladý muž si začal všímať, že polovica jeho stola sa neúprosne zmenšuje a stráca pôdu pod nohami pre vlasové peny a sójové komplexy. Počas posledných mesiacov ten chlap pozorne sledoval rýchlosť, akou narastal počet predmetov na jej strane stola. Nasledujúca tabuľka zobrazuje počet predmetov na dievčenskej toaletnej márnosti, ktoré sa nahromadili za posledných pár mesiacov.

Keďže naším cieľom je zistiť, či sa počet položiek časom zvyšuje, nezávislou premennou bude „Mesiac“ a závislou premennou „Počet položiek“.

Pomocou metódy najmenších štvorcov určíme rovnicu, ktorá najlepšie vyhovuje údajom, vypočítaním hodnôt a, priesečníka y a b, sklonu čiary:

a = y avg - bx avg

kde x avg je priemerná hodnota x, nezávislej premennej, y avg je priemerná hodnota y, nezávislej premennej.

V tabuľke nižšie sú zhrnuté výpočty potrebné pre tieto rovnice.

Efektová krivka pre náš príklad vane by bola daná nasledujúcou rovnicou:

Keďže naša rovnica má kladný sklon 0,976, chlap má dôkazy, že počet položiek na stole sa časom zvyšuje priemernou rýchlosťou 1 položka za mesiac. Graf zobrazuje krivku účinku s usporiadanými pármi.

Očakávaný počet položiek počas nasledujúcich šiestich mesiacov (16. mesiac) sa vypočíta takto:

ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 položiek

Takže je čas, aby náš hrdina podnikol nejaké kroky.

Funkcia TREND v Exceli

Ako ste už pravdepodobne uhádli, Excel má funkciu na výpočet hodnôt podľa metóda najmenších štvorcov. Táto funkcia sa nazýva TREND. Jeho syntax je nasledovná:

TREND (známe hodnoty Y; známe hodnoty X; nové hodnoty X; konštanta)

známe hodnoty Y – pole závislých premenných, v našom prípade počet objektov v tabuľke

známe hodnoty X – pole nezávislých premenných, v našom prípade je to mesiac

nové hodnoty X – nové hodnoty X (mesiace), pre ktoré Funkcia TREND vráti očakávanú hodnotu závislých premenných (počet položiek)

const - voliteľné. Booleovská hodnota, ktorá určuje, či sa vyžaduje, aby konštanta b bola 0.

Na obrázku je napríklad znázornená funkcia TREND slúžiaca na určenie predpokladaného počtu predmetov na umývadle v kúpeľni pre 16. mesiac.

Ak určitá fyzikálna veličina závisí od inej veličiny, potom túto závislosť možno študovať meraním y pri rôznych hodnotách x. V dôsledku meraní sa získa niekoľko hodnôt:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Na základe údajov takéhoto experimentu je možné zostrojiť graf závislosti y = ƒ(x). Výsledná krivka umožňuje posúdiť tvar funkcie ƒ(x). Konštantné koeficienty, ktoré vstupujú do tejto funkcie, však zostávajú neznáme. Možno ich určiť metódou najmenších štvorcov. Experimentálne body spravidla neležia presne na krivke. Metóda najmenších štvorcov vyžaduje, aby súčet druhých mocnín odchýlok experimentálnych bodov od krivky, t.j. 2 bol najmenší.

V praxi sa tento spôsob najčastejšie (a najjednoduchšie) používa v prípade lineárneho vzťahu, t.j. Kedy

y = kx alebo y = a + bx.

Lineárna závislosť je vo fyzike veľmi rozšírená. A aj keď je vzťah nelineárny, zvyčajne sa snažia zostaviť graf takým spôsobom, aby dostali priamku. Napríklad, ak sa predpokladá, že index lomu skla n súvisí s vlnovou dĺžkou svetla λ vzťahom n = a + b/λ 2, potom sa závislosť n na λ -2 vynesie do grafu.

Zvážte závislosť y = kx(priamka prechádzajúca počiatkom). Zostavme hodnotu φ súčet druhých mocnín odchýlok našich bodov od priamky

Hodnota φ je vždy kladná a tým je menšia, čím bližšie sú naše body k priamke. Metóda najmenších štvorcov uvádza, že hodnota pre k by mala byť zvolená tak, aby φ malo minimum


alebo
(19)

Výpočet ukazuje, že odmocnina pri určovaní hodnoty k sa rovná

, (20)
kde n je počet meraní.

Uvažujme teraz o trochu zložitejšom prípade, keď body musia spĺňať vzorec y = a + bx(priamka, ktorá neprechádza počiatkom).

Úlohou je nájsť najlepšie hodnoty a a b z dostupnej množiny hodnôt x i, y i.

Zostavme opäť kvadratickú formu φ, ktorá sa rovná súčtu štvorcových odchýlok bodov x i, y i od priamky

a nájdite hodnoty a a b, pre ktoré má φ minimum

;

.

.

Spoločné riešenie týchto rovníc dáva

(21)

Stredné kvadratické chyby určenia aab sú rovnaké

(23)

.  (24)

Pri spracovaní výsledkov meraní touto metódou je vhodné zhrnúť všetky údaje do tabuľky, v ktorej sú predbežne vypočítané všetky množstvá zahrnuté vo vzorcoch (19) (24). Formy týchto tabuliek sú uvedené v príkladoch nižšie.

Príklad 1 Bola študovaná základná rovnica dynamiky rotačného pohybu ε = M/J (priamka prechádzajúca počiatkom). Pri rôznych hodnotách momentu M sa meralo uhlové zrýchlenie ε určitého telesa. Je potrebné určiť moment zotrvačnosti tohto telesa. Výsledky meraní momentu sily a uhlového zrýchlenia sú uvedené v druhom a treťom stĺpci tabuľka 5.

Tabuľka 5
n M, Nm ε, s-1 M 2 M ε ε - km (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Pomocou vzorca (19) určíme:

.

Na určenie strednej kvadratickej chyby používame vzorec (20)

0.005775kg-1 · m -2 .

Podľa vzorca (18) máme

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Po nastavení spoľahlivosti P = 0,95 pomocou tabuľky Studentových koeficientov pre n = 5 nájdeme t = 2,78 a určíme absolútnu chybu ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Výsledky zapíšeme do tvaru:

J = (3,0 ± 0,2) kg m2;


Príklad 2 Vypočítajme teplotný koeficient odporu kovu metódou najmenších štvorcov. Odpor lineárne závisí od teploty

Rt = R° (1 + at°) = R° + R° at°.

Voľný člen určuje odpor R 0 pri teplote 0 °C a koeficient strmosti je súčinom teplotného koeficientu α a odporu R 0 .

Výsledky meraní a výpočtov sú uvedené v tabuľke ( pozri tabuľku 6).

Tabuľka 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Pomocou vzorcov (21), (22) určíme

Ro = ¯ R-αR0¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Nájdime chybu v definícii α. Od , potom podľa vzorca (18) máme:

.

Pomocou vzorcov (23), (24) máme

;

0.014126 Ohm.

Po nastavení spoľahlivosti na P = 0,95 pomocou tabuľky Studentových koeficientov pre n = 6 zistíme t = 2,57 a určíme absolútnu chybu Δα = 2,57 0,000132 = 0,000338 stupeň -1.

a = (23 ± 4) 10-4 krupobitie-1 pri P = 0,95.


Príklad 3 Je potrebné určiť polomer zakrivenia šošovky pomocou Newtonových krúžkov. Zmerali sa polomery Newtonových prstencov r m a určili sa počty týchto prstencov m. Polomery Newtonových prstencov súvisia s polomerom zakrivenia šošovky R a číslom prstenca rovnicou

r2m = mλR - 2d0R,

kde d 0 hrúbka medzery medzi šošovkou a planparalelnou doskou (alebo deformácia šošovky),

λ vlnová dĺžka dopadajúceho svetla.

A = (600 ± 6) nm;
r2 m = y;
m = x;
XR = b;
-2d 0 R = a,

potom rovnica nadobudne tvar y = a + bx.

.

Vkladajú sa výsledky meraní a výpočtov tabuľka 7.

Tabuľka 7
n x = m y = r2, 10-2 mm2 m -¯m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2, 10-6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Metóda obyčajných najmenších štvorcov (OLS).- matematická metóda používaná na riešenie rôznych úloh, založená na minimalizácii súčtu kvadrátov odchýlok určitých funkcií od požadovaných premenných. Dá sa použiť na „riešenie“ preurčených sústav rovníc (keď počet rovníc prevyšuje počet neznámych), na hľadanie riešení v prípade obyčajných (nie preurčených) nelineárnych sústav rovníc, na aproximáciu bodových hodnôt niektorých funkciu. OLS je jednou zo základných metód regresnej analýzy na odhadovanie neznámych parametrov regresných modelov zo vzorových údajov.

Encyklopedický YouTube

    1 / 5

    ✪ Metóda najmenších štvorcov. Predmet

    ✪ Metóda najmenších štvorcov, lekcia 1/2. Lineárna funkcia

    ✪ Ekonometria. Prednáška 5. Metóda najmenších štvorcov

    ✪ Mitin I.V. - Spracovanie fyzických výsledkov. experiment - Metóda najmenších štvorcov (4. prednáška)

    ✪ Ekonometria: Podstata metódy najmenších štvorcov #2

    titulky

Príbeh

Do začiatku 19. stor. vedci nemali isté pravidlá na riešenie sústavy rovníc, v ktorej je počet neznámych menší ako počet rovníc; Dovtedy sa používali súkromné ​​techniky, ktoré záviseli od typu rovníc a od dôvtipu kalkulačiek, a preto rôzne kalkulačky na základe rovnakých pozorovacích údajov dospeli k rôznym záverom. Gauss (1795) bol prvý, kto použil túto metódu, a Legendre (1805) ju nezávisle objavil a publikoval pod jej moderným názvom (franc. Methode des moindres quarrés). Laplace spojil metódu s teóriou pravdepodobnosti a americký matematik Adrain (1808) uvažoval o jej teoreticko-teoretickom použití. Metóda bola rozšírená a zdokonalená ďalším výskumom Enckeho, Bessela, Hansena a ďalších.

Podstata metódy najmenších štvorcov

Nechaj x (\displaystyle x)- súprava n (\displaystyle n) neznáme premenné (parametre), f i (x) (\displaystyle f_(i)(x)), , m > n (\displaystyle m>n)- množina funkcií z tejto množiny premenných. Úlohou je vybrať takéto hodnoty x (\displaystyle x), aby sa hodnoty týchto funkcií čo najviac približovali určitým hodnotám y i (\displaystyle y_(i)). V podstate hovoríme o „riešení“ predefinovaného systému rovníc f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\displaystyle i=1,\ldots ,m) v naznačenom zmysle maximálnej blízkosti ľavej a pravej časti systému. Podstatou metódy najmenších štvorcov je vybrať ako „mieru blízkosti“ súčet štvorcových odchýlok ľavej a pravej strany. | f i (x) − y i | (\displaystyle |f_(i)(x)-y_(i)|). Podstatu MNC možno teda vyjadriť takto:

∑ i e i 2 = ∑ i (y i − f i (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\šípka doprava \min _(x)).

Ak má sústava rovníc riešenie, tak minimum súčtu štvorcov sa bude rovnať nule a presné riešenia sústavy rovníc možno nájsť analyticky alebo napríklad pomocou rôznych numerických optimalizačných metód. Ak je systém preurčený, teda voľne povedané, počet nezávislých rovníc je väčší ako počet požadovaných premenných, potom systém nemá presné riešenie a metóda najmenších štvorcov nám umožňuje nájsť nejaký „optimálny“ vektor. x (\displaystyle x) v zmysle maximálnej blízkosti vektorov y (\displaystyle y) A f (x) (\displaystyle f(x)) alebo maximálna blízkosť vektora odchýlky e (\displaystyle e) k nule (blízkosť sa chápe v zmysle euklidovskej vzdialenosti).

Príklad - sústava lineárnych rovníc

Najmä metóda najmenších štvorcov môže byť použitá na "riešenie" systému lineárnych rovníc

A x = b (\displaystyle Ax=b),

Kde A (\displaystyle A) matica obdĺžnikovej veľkosti m × n , m > n (\displaystyle m\times n,m>n)(t.j. počet riadkov matice A je väčší ako počet hľadaných premenných).

Vo všeobecnom prípade takýto systém rovníc nemá riešenie. Preto je možné tento systém „riešiť“ len v zmysle výberu takéhoto vektora x (\displaystyle x) minimalizovať "vzdialenosť" medzi vektormi A x (\displaystyle Axe) A b (\displaystyle b). Na tento účel môžete použiť kritérium minimalizácie súčtu štvorcov rozdielov medzi ľavou a pravou stranou systémových rovníc, tj. (A x − b) T (A x − b) → min (\displaystyle (Ax-b)^(T)(Ax-b)\rightarrow \min ). Je ľahké ukázať, že riešenie tohto problému minimalizácie vedie k riešeniu nasledujúceho systému rovníc

A T A x = A T b ⇒ x = (A T A) − 1 A T b (\displaystyle A^(T)Ax=A^(T)b\šípka doprava x=(A^(T)A)^(-1)A^ (T)b).

OLS v regresnej analýze (aproximácia údajov)

Nech je tam n (\displaystyle n) hodnoty nejakej premennej y (\displaystyle y)(mohli by to byť výsledky pozorovaní, experimentov atď.) a súvisiace premenné x (\displaystyle x). Výzvou je zabezpečiť, aby vzťah medzi y (\displaystyle y) A x (\displaystyle x) aproximovať nejakou funkciou známou až po niektoré neznáme parametre b (\displaystyle b), teda skutočne nájsť najlepšie hodnoty parametrov b (\displaystyle b), čo sa maximálne približuje k hodnotám f (x, b) (\displaystyle f(x,b)) na skutočné hodnoty y (\displaystyle y). V skutočnosti ide o prípad „riešenia“ príliš určeného systému rovníc vzhľadom na b (\displaystyle b):

F (x t , b) = y t , t = 1 , … , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

V regresnej analýze a najmä v ekonometrii sa používajú pravdepodobnostné modely závislosti medzi premennými

Yt = f (x t, b) + ε t (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

Kde ε t (\displaystyle \varepsilon _(t))- tzv náhodné chyby modelov.

V súlade s tým odchýlky pozorovaných hodnôt y (\displaystyle y) z modelu f (x, b) (\displaystyle f(x,b)) sa predpokladá už v samotnom modeli. Podstatou metódy najmenších štvorcov (obyčajnej, klasickej) je nájsť takéto parametre b (\displaystyle b), pri ktorej súčet štvorcových odchýlok (chyby, pre regresné modely sa často nazývajú regresné rezíduá) e t (\displaystyle e_(t)) bude minimálny:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\klobúk (b))_(OLS)=\arg \min _(b)RSS(b)),

Kde R S S (\displaystyle RSS)- Angličtina Zvyšný súčet štvorcov je definovaný ako:

R S S (b) = e T e = ∑ t = 1 n e t 2 = ∑ t = 1 n (y t − f (x t, b)) 2 (\displaystyle RSS(b)=e^(T)e=\sum _ (t=1)^(n)e_(t)^(2)=\súčet _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

Vo všeobecnom prípade možno tento problém vyriešiť metódami numerickej optimalizácie (minimalizácie). V tomto prípade hovoria o nelineárne najmenšie štvorce(NLS alebo NLLS - anglické nelineárne najmenšie štvorce). V mnohých prípadoch je možné získať analytické riešenie. Na vyriešenie problému minimalizácie je potrebné nájsť stacionárne body funkcie R S S (b) (\displaystyle RSS(b)), pričom sa rozlišuje podľa neznámych parametrov b (\displaystyle b), prirovnanie derivácií k nule a riešenie výslednej sústavy rovníc:

∑ t = 1 n (y t − f (x t, b)) ∂ f (x t, b) ∂ b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_ (t),b))(\frac (\čiastočné f(x_(t),b))(\čiastočné b))=0).

OLS v prípade lineárnej regresie

Nech je regresná závislosť lineárna:

y t = ∑ j = 1 k b j x t j + ε = x t T b + ε t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

Nechaj r je stĺpcový vektor pozorovaní vysvetľovanej premennej a X (\displaystyle X)- Toto (n × k) (\displaystyle ((n\krát k)))-matica pozorovaní faktorov (riadky matice sú vektory hodnôt faktorov v danom pozorovaní, stĺpce sú vektory hodnôt daného faktora vo všetkých pozorovaniach). Maticová reprezentácia lineárneho modelu má tvar:

y = X b + ε (\displaystyle y=Xb+\varepsilon ).

Potom sa vektor odhadov vysvetľovanej premennej a vektor regresných zvyškov budú rovnať

y ^ = X b , e = y − y ^ = y − X b (\displaystyle (\klobúk (y))=Xb,\quad e=y-(\klobúk (y))=y-Xb).

Súčet druhých mocnín regresných zvyškov sa teda bude rovnať

R S S = e T e = (y − X b) T (y − X b) (\displaystyle RSS=e^(T)e=(y-Xb)^(T)(y-Xb)).

Rozlíšenie tejto funkcie vzhľadom na vektor parametrov b (\displaystyle b) a prirovnaním derivátov k nule dostaneme systém rovníc (v maticovej forme):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

Vo forme dešifrovanej matice tento systém rovníc vyzerá takto:

(∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x t k 2 x t x 3 … 2 x t k 2 x t x 3 x 2 x 3 x 3 ∑ x t 3 x t 2 ∑ x t 3 2 … ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2) (b 1 k 2) (b 3 k 1 b) ∑ x t 2 y t ∑ x t 3 y t ⋮ ∑ x t k y t) , (\displaystyle (\začiatok(pmatrix)\súčet x_(t1)^(2)&\súčet x_(t1)x_(t2)&\súčet x_(t1)x_(t3)&\ldots &\súčet x_(t1)x_(tk)\\\súčet x_(t2)x_(t1)&\súčet x_(t2)^(2)&\súčet x_(t2)x_(t3)&\ldots &\ súčet x_(t2)x_(tk)\\\súčet x_(t3)x_(t1)&\súčet x_(t3)x_(t2)&\súčet x_(t3)^(2)&\ldots &\súčet x_ (t3)x_(tk)\\\vbodky &\vbodky &\vbodky &\dbodky &\vbodky \\\súčet x_(tk)x_(t1)&\súčet x_(tk)x_(t2)&\súčet x_ (tk)x_(t3)&\ldots &\sum x_(tk)^(2)\\\koniec (pmatrix))(\začiatok (pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vbodky \\b_(k)\\\koniec (pmatica))=(\začiatok (pmatica)\súčet x_(t1)y_(t)\\\súčet x_(t2)y_(t)\\ \sum x_(t3)y_(t)\\\vbodky \\\sučet x_(tk)y_(t)\\\end(pmatrix)),) kde všetky súčty preberajú všetky platné hodnoty t (\displaystyle t).

Ak je v modeli zahrnutá konštanta (ako obvykle), potom x t 1 = 1 (\displaystyle x_(t1)=1) pred všetkými t (\displaystyle t), preto je v ľavom hornom rohu matice sústavy rovníc uvedený počet pozorovaní n (\displaystyle n) a vo zvyšných prvkoch prvého riadku a prvého stĺpca – jednoducho súčty hodnôt premenných: ∑ x t j (\displaystyle \sum x_(tj)) a prvým prvkom pravej strany systému je ∑ y t (\displaystyle \sum y_(t)).

Riešenie tohto systému rovníc dáva všeobecný vzorec pre odhady najmenších štvorcov pre lineárny model:

b ^ O L S = (X T X) − 1 X T y = (1 n X T X) − 1 1 n X T y = V x − 1 C x y (\displaystyle (\klobúk (b))_(OLS)=(X^(T )X)^(-1)X^(T)y=\vľavo((\frac (1)(n))X^(T)X\vpravo)^(-1)(\frac (1)(n) ))X^(T)y=V_(x)^(-1)C_(xy)).

Pre analytické účely sa ukazuje ako užitočné posledné znázornenie tohto vzorca (v sústave rovníc pri delení n sa namiesto súčtov objavujú aritmetické priemery). Ak v regresnom modeli dáta vycentrované, potom v tomto znázornení má prvá matica význam vzorovej kovariančnej matice faktorov a druhá je vektorom kovariancií faktorov so závislou premennou. Ak sú navyše údaje aj normalizované na MSE (teda v konečnom dôsledku štandardizované), potom prvá matica má význam výberovej korelačnej matice faktorov, druhý vektor - vektor výberových korelácií faktorov so závislou premennou.

Dôležitá vlastnosť odhadov OLS pre modely s konštantným- zostrojená regresná čiara prechádza ťažiskom vzorových údajov, to znamená, že je splnená rovnosť:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x ¯ j (\displaystyle (\bar (y))=(\klobúk (b_(1)))+\sum _(j=2)^(k) (\klobúk (b))_(j)(\bar (x))_(j)).

Najmä v extrémnom prípade, keď jediným regresorom je konštanta, zistíme, že odhad OLS jediného parametra (samotnej konštanty) sa rovná priemernej hodnote vysvetľovanej premennej. To znamená, že aritmetický priemer, známy svojimi dobrými vlastnosťami zo zákonov veľkých čísel, je tiež odhadom najmenších štvorcov – spĺňa kritérium minimálneho súčtu odchýlok na druhú.

Najjednoduchšie špeciálne prípady

V prípade párovej lineárnej regresie y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), keď sa odhadne lineárna závislosť jednej premennej od druhej, výpočtové vzorce sa zjednodušia (vystačíte si s maticovou algebrou). Sústava rovníc má tvar:

(1 x ¯ x ¯ x 2 ¯) (a b) = (y ¯ x y ¯) (\displaystyle (\začiatok(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar (x^(2)))\\\koniec(pmatica))(\začiatok(pmatica)a\\b\\\koniec(pmatica))=(\začiatok(pmatica)(\bar (y))\\ (\overline (xy))\\\end(pmatrix))).

Odtiaľ je ľahké nájsť odhady koeficientov:

( b ^ = Cov ⁡ (x, y) Var ⁡ (x) = x y ¯ − x ¯ y ¯ x 2 ¯ − x ¯ 2 , a ^ = y ¯ − b x ¯ . (\displaystyle (\begin(cases)) (\hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline (xy))-(\bar (x))(\bar (y)))((\overline (x^(2)))-(\overline (x))^(2))),\\( \hat (a))=(\bar (y))-b(\bar (x)).\end(cases)))

Napriek tomu, že vo všeobecnom prípade sú preferované modely s konštantou, v niektorých prípadoch je z teoretických úvah známe, že konštanta a (\displaystyle a) sa musí rovnať nule. Napríklad vo fyzike je vzťah medzi napätím a prúdom U = I ⋅ R (\displaystyle U=I\cdot R); Pri meraní napätia a prúdu je potrebné odhadnúť odpor. V tomto prípade hovoríme o modeli y = b x (\displaystyle y=bx). V tomto prípade namiesto sústavy rovníc máme jednu rovnicu

(∑ x t 2) b = ∑ x t y t (\displaystyle \left(\sum x_(t)^(2)\right)b=\sum x_(t)y_(t)).

Preto vzorec na odhad jediného koeficientu má tvar

B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t )y_(t))(\súčet _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

Prípad polynomického modelu

Ak sú údaje fitované polynomickou regresnou funkciou jednej premennej f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), potom vnímanie stupňov x i (\displaystyle x^(i)) ako nezávislé faktory pre každého i (\displaystyle i) je možné odhadnúť parametre modelu na základe všeobecného vzorca pre odhad parametrov lineárneho modelu. Na to stačí vo všeobecnom vzorci vziať do úvahy, že pri takejto interpretácii x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j)) A x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). V dôsledku toho budú mať maticové rovnice v tomto prípade tvar:

(n ∑ n x t … ∑ n x t k ∑ n x t ∑ n x t 2 … ∑ n x t k + 1 ⋮ ⋮ ⋱ ⋮ ∑ n x t k ∑ n x t k + b 2 k 1 … ] = [ ∑ n y t ∑ n t y t ⋮ ∑ n x t k y t ]. (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\súčet \limity _(n)x_(t)^(2)&\ldots &\sum \limits _(n)x_(t)^(k+1)\\\vbodky & \vbodky &\dbodky &\vbodky \\\súčet \limity _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ súčet \limits _(n)x_(t)^(2k)\end(pmatrix))(\začiatok(bmatrix)b_(0)\\b_(1)\\\vbodky \\b_(k)\end( bmatrix))=(\začiatok(bmatica)\súčet \limity _(n)y_(t)\\\súčet \limity _(n)x_(t)y_(t)\\\vbodky \\\súčet \limity _(n)x_(t)^(k)y_(t)\end(bmatica)).)

Štatistické vlastnosti odhadov OLS

V prvom rade si všimneme, že pre lineárne modely sú odhady OLS lineárne odhady, ako vyplýva z vyššie uvedeného vzorca. Pre nestranné odhady OLS je potrebné a postačujúce splniť najdôležitejšiu podmienku regresnej analýzy: matematické očakávanie náhodnej chyby podmienené faktormi sa musí rovnať nule. Táto podmienka je splnená najmä vtedy, ak

  1. matematické očakávanie náhodných chýb je nulové a
  2. faktory a náhodné chyby sú nezávislé náhodné premenné.

Druhá podmienka – podmienka exogenity faktorov – je zásadná. Ak táto vlastnosť nie je splnená, potom môžeme predpokladať, že takmer všetky odhady budú mimoriadne neuspokojivé: dokonca nebudú konzistentné (to znamená, že ani veľmi veľké množstvo údajov nám v tomto prípade neumožňuje získať vysoko kvalitné odhady ). V klasickom prípade sa silnejšie predpokladá determinizmus faktorov, na rozdiel od náhodnej chyby, ktorá automaticky znamená, že podmienka exogenity je splnená. Vo všeobecnom prípade pre konzistentnosť odhadov stačí splniť podmienku exogenity spolu s konvergenciou matice V x (\displaystyle V_(x)) do nejakej nesingulárnej matice, keď sa veľkosť vzorky zväčšuje do nekonečna.

Aby boli okrem konzistentnosti a nezaujatosti efektívne aj odhady (zvyčajnej) metódy najmenších štvorcov (najlepšie v triede lineárnych neskreslených odhadov), je potrebné splniť ďalšie vlastnosti náhodnej chyby:

Tieto predpoklady možno formulovať pre kovariančnú maticu vektora náhodnej chyby V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I).

Lineárny model, ktorý tieto podmienky spĺňa, sa nazýva tzv klasický. Odhady OLS pre klasickú lineárnu regresiu sú nezaujaté, konzistentné a najefektívnejšie odhady v triede všetkých lineárnych neskreslených odhadov (v anglickej literatúre sa niekedy používa skratka MODRÁ (Najlepší lineárny nezaujatý odhad) - najlepší lineárny nezaujatý odhad; V ruskej literatúre sa častejšie cituje Gauss-Markovova veta). Ako je ľahké ukázať, kovariančná matica vektora odhadov koeficientov sa bude rovnať:

V (b ^ O L S) = σ 2 (X T X) − 1 (\displaystyle V((\hat (b))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

Účinnosť znamená, že táto kovariančná matica je „minimálna“ (akákoľvek lineárna kombinácia koeficientov a najmä koeficienty samotné majú minimálny rozptyl), to znamená, že v triede lineárnych nezaujatých odhadov sú najlepšie odhady OLS. Diagonálne prvky tejto matice - rozptyly odhadov koeficientov - sú dôležitými parametrami kvality získaných odhadov. Nie je však možné vypočítať kovariančnú maticu, pretože rozptyl náhodnej chyby nie je známy. Dá sa dokázať, že nezaujatým a konzistentným (pre klasický lineárny model) odhadom rozptylu náhodných chýb je množstvo:

S 2 = R S S / (n − k) (\displaystyle s^(2)=RSS/(n-k)).

Dosadením tejto hodnoty do vzorca pre kovariančnú maticu získame odhad kovariančnej matice. Výsledné odhady sú tiež nezaujaté a konzistentné. Je tiež dôležité, že odhad rozptylu chýb (a tým aj rozptylu koeficientov) a odhady parametrov modelu sú nezávislé náhodné premenné, čo umožňuje získať testovaciu štatistiku na testovanie hypotéz o modelových koeficientoch.

Treba poznamenať, že ak nie sú splnené klasické predpoklady, odhady parametrov OLS nie sú najefektívnejšie a tam, kde W (\displaystyle W) je nejaká symetrická pozitívne definitná matica váh. Konvenčné najmenšie štvorce sú špeciálnym prípadom tohto prístupu, kde je matica váh úmerná matici identity. Ako je známe, pre symetrické matice (alebo operátory) dochádza k expanzii W = P T P (\displaystyle W=P^(T)P). Preto môže byť špecifikovaná funkcia reprezentovaná nasledovne e T P T P e = (P e) T P e = e ∗ T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), to znamená, že tento funkcionál môže byť reprezentovaný ako súčet druhých mocnín niektorých transformovaných „zvyškov“. Môžeme teda rozlíšiť triedu metód najmenších štvorcov – metódy LS (Least Squares).

Bolo dokázané (Aitkenova veta), že pre zovšeobecnený lineárny regresný model (v ktorom nie sú kladené žiadne obmedzenia na kovariančnú maticu náhodných chýb) sú najúčinnejšie (v triede lineárnych nezaujatých odhadov) tzv. zovšeobecnené najmenšie štvorce (GLS – Generalized Least Squares)- LS metóda s váhovou maticou rovnajúcou sa inverznej kovariančnej matici náhodných chýb: W = V ε − 1 (\displaystyle W=V_(\varepsilon )^(-1)).

Dá sa ukázať, že vzorec pre GLS odhady parametrov lineárneho modelu má tvar

B ^ G L S = (X T V − 1 X) − 1 X T V − 1 y (\displaystyle (\klobúk (b))_(GLS)=(X^(T)V^(-1)X)^(-1) X^(T)V^(-1)y).

Kovariančná matica týchto odhadov sa teda bude rovnať

V (b ^ G L S) = (X T V − 1 X) − 1 (\displaystyle V((\hat (b))_(GLS))=(X^(T)V^(-1)X)^(- 1)).

V skutočnosti podstata OLS spočíva v určitej (lineárnej) transformácii (P) pôvodných dát a aplikácii obyčajnej OLS na transformované dáta. Účelom tejto transformácie je, že pre transformované dáta náhodné chyby už spĺňajú klasické predpoklady.

Vážené OLS

V prípade diagonálnej váhovej matice (a teda kovariančnej matice náhodných chýb) máme takzvané vážené najmenšie štvorce (WLS). V tomto prípade je vážený súčet štvorcov rezíduí modelu minimalizovaný, to znamená, že každé pozorovanie dostane „váhu“, ktorá je nepriamo úmerná rozptylu náhodnej chyby v tomto pozorovaní: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ sigma_(t)^(2)))). V skutočnosti sa údaje transformujú vážením pozorovaní (vydelením čiastkou úmernou odhadovanej štandardnej odchýlke náhodných chýb) a na vážené údaje sa aplikuje obyčajná OLS.

ISBN 978-5-7749-0473-0 .

  • Ekonometria. Učebnica / Ed. Eliseeva I.I. - M.: Financie a štatistika, 2006. - 576 s. - ISBN 5-279-02786-3.
  • Alexandrova N.V. História matematických termínov, pojmov, zápisov: slovník-príručka. - 3. vyd. - M.: LKI, 2008. - 248 s. - ISBN 978-5-382-00839-4. I.V Mitin, Rusakov V.S. Analýza a spracovanie experimentálnych údajov - 5. vydanie - 24 s.
  • Má veľa aplikácií, keďže umožňuje približnú reprezentáciu danej funkcie inými jednoduchšími. LSM môže byť mimoriadne užitočné pri spracovaní pozorovaní a aktívne sa používa na odhadovanie niektorých veličín na základe výsledkov meraní iných, ktoré obsahujú náhodné chyby. V tomto článku sa dozviete, ako implementovať výpočty najmenších štvorcov v Exceli.

    Vyjadrenie problému na konkrétnom príklade

    Predpokladajme, že existujú dva indikátory X a Y. Okrem toho Y závisí od X. Keďže nás OLS zaujíma z pohľadu regresnej analýzy (v Exceli sú jej metódy implementované pomocou vstavaných funkcií), mali by sme okamžite prejsť na konkrétny problém.

    Nech teda X je maloobchodná plocha obchodu s potravinami meraná v metroch štvorcových a Y je ročný obrat stanovený v miliónoch rubľov.

    Je potrebné urobiť prognózu, aký obrat (Y) bude mať obchod, ak bude mať ten alebo ten obchodný priestor. Je zrejmé, že funkcia Y = f (X) rastie, keďže hypermarket predáva viac tovaru ako stánok.

    Niekoľko slov o správnosti počiatočných údajov použitých na predikciu

    Povedzme, že máme tabuľku zostavenú pomocou údajov pre n obchodov.

    Podľa matematických štatistík budú výsledky viac-menej správne, ak sa preskúmajú údaje aspoň o 5-6 objektoch. Okrem toho nemožno použiť „anomálne“ výsledky. Najmä elitný malý butik môže mať obrat, ktorý je niekoľkonásobne vyšší ako obrat veľkých maloobchodných predajní triedy „masmarket“.

    Podstata metódy

    Tabuľkové dáta môžu byť zobrazené na karteziánskej rovine v tvare bodov M 1 (x 1, y 1), ... M n (x n, y n). Teraz sa riešenie úlohy zredukuje na výber aproximačnej funkcie y = f (x), ktorá má graf prechádzajúci čo najbližšie k bodom M 1, M 2, .. M n.

    Samozrejme, môžete použiť polynóm vysokého stupňa, ale táto možnosť je nielen náročná na implementáciu, ale aj jednoducho nesprávna, pretože nebude odrážať hlavný trend, ktorý je potrebné zistiť. Najrozumnejším riešením je hľadať priamku y = ax + b, ktorá najlepšie aproximuje experimentálne údaje, presnejšie koeficienty a a b.

    Hodnotenie presnosti

    Pri akejkoľvek aproximácii je mimoriadne dôležité posúdiť jej presnosť. Označme e i rozdiel (odchýlku) medzi funkčnou a experimentálnou hodnotou pre bod x i, teda e i = y i - f (x i).

    Je zrejmé, že na posúdenie presnosti aproximácie môžete použiť súčet odchýlok, t.j. pri výbere priamky na približné znázornenie závislosti X na Y musíte uprednostniť tú s najmenšou hodnotou súčet e i vo všetkých posudzovaných bodoch. Nie všetko je však také jednoduché, pretože spolu s pozitívnymi odchýlkami budú existovať aj negatívne.

    Problém je možné vyriešiť pomocou modulov odchýlky alebo ich štvorcov. Posledná metóda je najpoužívanejšia. Používa sa v mnohých oblastiach vrátane regresnej analýzy (v Exceli je implementovaná pomocou dvoch vstavaných funkcií) a už dlho sa osvedčila ako účinná.

    Metóda najmenších štvorcov

    Excel, ako viete, má vstavanú funkciu AutoSum, ktorá vám umožňuje vypočítať hodnoty všetkých hodnôt nachádzajúcich sa vo vybranom rozsahu. Nič nám teda nebude brániť vypočítať hodnotu výrazu (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

    V matematickom zápise to vyzerá takto:

    Keďže sa pôvodne rozhodlo o aproximácii pomocou priamky, máme:

    Úloha nájsť priamku, ktorá najlepšie popisuje špecifickú závislosť veličín X a Y, teda spočíva na výpočte minima funkcie dvoch premenných:

    Aby ste to dosiahli, musíte prirovnať parciálne derivácie vzhľadom na nové premenné a a b k nule a vyriešiť primitívny systém pozostávajúci z dvoch rovníc s 2 neznámymi tvaru:

    Po niekoľkých jednoduchých transformáciách, vrátane delenia 2 a manipulácie so súčtami, dostaneme:

    Riešením napríklad Cramerovou metódou získame stacionárny bod s určitými koeficientmi a * a b *. Toto je minimum, t. j. na predpovedanie, aký obrat bude mať obchod pre určitú oblasť, je vhodná priamka y = a * x + b *, čo je regresný model pre daný príklad. Samozrejme, neumožní vám nájsť presný výsledok, ale pomôže vám získať predstavu o tom, či sa nákup konkrétnej oblasti na kredit v obchode oplatí.

    Ako implementovať najmenšie štvorce v Exceli

    Excel má funkciu na výpočet hodnôt pomocou najmenších štvorcov. Má nasledujúci tvar: „TREND“ (známe hodnoty Y; známe hodnoty X; nové hodnoty X; konštanta). Aplikujme vzorec na výpočet OLS v Exceli na našu tabuľku.

    Za týmto účelom zadajte znak „=“ do bunky, v ktorej sa má zobraziť výsledok výpočtu metódou najmenších štvorcov v Exceli, a vyberte funkciu „TREND“. V okne, ktoré sa otvorí, vyplňte príslušné polia a zvýraznite:

    • rozsah známych hodnôt pre Y (v tomto prípade údaje pre obchodný obrat);
    • rozsah x 1, … x n, t. j. veľkosť predajnej plochy;
    • známe aj neznáme hodnoty x, pre ktoré musíte zistiť veľkosť obratu (informácie o ich umiestnení na pracovnom hárku nájdete nižšie).

    Okrem toho vzorec obsahuje logickú premennú „Const“. Ak do príslušného poľa zadáte 1, znamená to, že by ste mali vykonať výpočty za predpokladu, že b = 0.

    Ak potrebujete zistiť predpoveď pre viac ako jednu hodnotu x, po zadaní vzorca by ste nemali stlačiť „Enter“, ale musíte na klávesnici zadať kombináciu „Shift“ + „Control“ + „Enter“.

    Niektoré funkcie

    Regresná analýza môže byť prístupná aj pre figuríny. Excelovský vzorec na predpovedanie hodnoty poľa neznámych premenných — TREND — môžu použiť aj tí, ktorí nikdy nepočuli o najmenších štvorcoch. Stačí poznať niektoré črty jeho práce. Konkrétne:

    • Ak usporiadate rozsah známych hodnôt premennej y do jedného riadku alebo stĺpca, potom každý riadok (stĺpec) so známymi hodnotami x bude programom vnímaný ako samostatná premenná.
    • Ak v okne TREND nie je zadaný rozsah so známym x, tak pri použití funkcie v Exceli ho program bude považovať za pole pozostávajúce z celých čísel, ktorých počet zodpovedá rozsahu s danými hodnotami premenné y.
    • Na výstup poľa „predpovedaných“ hodnôt je potrebné zadať výraz na výpočet trendu ako vzorec poľa.
    • Ak nie sú zadané nové hodnoty x, funkcia TREND ich považuje za rovnaké ako tie známe. Ak nie sú špecifikované, potom sa pole 1 berie ako argument; 2; 3; 4;…, ktorý je primeraný rozsahu s už špecifikovanými parametrami y.
    • Rozsah obsahujúci nové hodnoty x musí mať rovnaký alebo viac riadkov alebo stĺpcov ako rozsah obsahujúci dané hodnoty y. Inými slovami, musí byť úmerná nezávislým premenným.
    • Pole so známymi hodnotami x môže obsahovať viacero premenných. Ak však hovoríme len o jednom, potom je potrebné, aby rozsahy s danými hodnotami x a y boli úmerné. V prípade viacerých premenných je potrebné, aby sa rozsah s danými hodnotami y zmestil do jedného stĺpca alebo jedného riadku.

    Funkcia PREDICTION

    Implementované pomocou niekoľkých funkcií. Jeden z nich sa nazýva „PREDIKCIA“. Je to podobné ako „TREND“, t.j. dáva výsledok výpočtov metódou najmenších štvorcov. Avšak len pre jedno X, pre ktoré je hodnota Y neznáma.

    Teraz poznáte vzorce v Exceli pre figuríny, ktoré vám umožňujú predpovedať budúcu hodnotu konkrétneho ukazovateľa podľa lineárneho trendu.