Mažiausių kvadratų metodo taikymas. Eksperimentinių duomenų aproksimacija. Mažiausio kvadrato metodas

Mažiausio kvadrato metodas naudojami regresijos lygties parametrams įvertinti.
Eilučių skaičius (šaltinio duomenys)

Vienas iš metodų tiriant stochastinius ryšius tarp charakteristikų yra regresinė analizė.
Regresinė analizė – tai regresinės lygties išvedimas, kurios pagalba randama atsitiktinio dydžio (rezultato požymio) vidutinė reikšmė, jei žinoma kitų (ar kitų) kintamųjų (veiksnių-atributų) reikšmė. Tai apima šiuos veiksmus:

  1. ryšio formos parinkimas (analitinės regresijos lygties tipas);
  2. lygties parametrų įvertinimas;
  3. analitinės regresijos lygties kokybės įvertinimas.
Dažniausiai statistiniam požymių ryšiui apibūdinti naudojama tiesinė forma. Dėmesys tiesiniams ryšiams paaiškinamas aiškiu ekonominiu jo parametrų aiškinimu, ribota kintamųjų variacija ir tuo, kad daugeliu atvejų netiesinės ryšių formos konvertuojamos (logaritmu arba pakeičiant kintamuosius) į tiesinę formą skaičiavimams atlikti. .
Tiesinio porinio ryšio atveju regresijos lygtis bus tokia: y i =a+b·x i +u i . Šios lygties parametrai a ir b įvertinti pagal statistinių stebėjimų duomenis x ir y. Tokio vertinimo rezultatas yra lygtis: , kur , yra parametrų a ir b įverčiai, yra gauto požymio (kintamojo), gauto iš regresijos lygties, reikšmė (apskaičiuota reikšmė).

Dažniausiai naudojamas parametrams įvertinti Mažiausių kvadratų metodas (LSM).
Mažiausių kvadratų metodas pateikia geriausius (nuoseklius, efektyvius ir nešališkus) regresijos lygties parametrų įverčius. Bet tik tuo atveju, jei tenkinamos tam tikros prielaidos dėl atsitiktinio termino (u) ir nepriklausomo kintamojo (x) (žr. OLS prielaidas).

Tiesinės poros lygties parametrų įvertinimo mažiausių kvadratų metodu problema yra taip: gauti tokius parametrų įverčius , , kai gaunamos charakteristikos - y i - faktinių verčių kvadratinių nuokrypių suma nuo apskaičiuotų verčių yra minimali.
Formaliai OLS testas galima parašyti taip: .

Mažiausių kvadratų metodų klasifikacija

  1. Mažiausio kvadrato metodas.
  2. Didžiausios tikimybės metodas (normaliam klasikiniam tiesinės regresijos modeliui postuluojamas regresijos liekanų normalumas).
  3. Apibendrintas mažiausių kvadratų OLS metodas naudojamas klaidų autokoreliacijos ir heteroskedastikos atveju.
  4. Svertinių mažiausių kvadratų metodas (ypatingas OLS atvejis su heteroskedastiniais likučiais).

Iliustruojame esmę klasikinis mažiausių kvadratų metodas grafiškai. Tam, remdamiesi stebėjimo duomenimis (x i, y i, i=1;n), sudarysime sklaidos grafiką stačiakampėje koordinačių sistemoje (toks sklaidos grafikas vadinamas koreliacijos lauku). Pabandykime pasirinkti tiesę, kuri yra arčiausiai koreliacijos lauko taškų. Pagal mažiausių kvadratų metodą tiesė parenkama taip, kad vertikalių atstumų tarp koreliacijos lauko taškų ir šios tiesės kvadratų suma būtų minimali.

Matematinis šios problemos žymėjimas: .
Mums žinomos y i ir x i = 1...n reikšmės, tai yra stebėjimo duomenys. S funkcijoje jie reiškia konstantas. Šios funkcijos kintamieji yra būtini parametrų įverčiai - , . Norint rasti dviejų kintamųjų funkcijos minimumą, reikia kiekvienam iš parametrų apskaičiuoti šios funkcijos dalines išvestines ir prilyginti jas nuliui, t.y. .
Dėl to gauname 2 normalių tiesinių lygčių sistemą:
Išspręsdami šią sistemą, randame reikiamus parametrų įvertinimus:

Regresijos lygties parametrų skaičiavimo teisingumą galima patikrinti lyginant sumas (dėl skaičiavimų apvalinimo gali atsirasti tam tikras neatitikimas).
Norėdami apskaičiuoti parametrų įvertinimus, galite sudaryti 1 lentelę.
Regresijos koeficiento b ženklas rodo ryšio kryptį (jei b >0, ryšys tiesioginis, jei b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formaliai parametro a reikšmė yra vidutinė y reikšmė, kai x lygi nuliui. Jei atributo faktorius neturi ir negali turėti nulinės reikšmės, tai aukščiau pateiktas parametro a aiškinimas neturi prasmės.

Požymių santykio glaudumo vertinimas atlikta naudojant tiesinės poros koreliacijos koeficientą - r x,y. Jį galima apskaičiuoti naudojant formulę: . Be to, tiesinės poros koreliacijos koeficientą galima nustatyti naudojant regresijos koeficientą b: .
Tiesinės poros koreliacijos koeficiento priimtinų verčių diapazonas yra nuo –1 iki +1. Koreliacijos koeficiento ženklas rodo ryšio kryptį. Jei r x, y >0, tai ryšys yra tiesioginis; jei r x, y<0, то связь обратная.
Jei šis koeficientas yra artimas vienetui pagal dydį, tada charakteristikų santykis gali būti interpretuojamas kaip gana artimas tiesinis. Jei jo modulis lygus vienam ê r x , y ê =1, tai ryšys tarp charakteristikų yra funkcinis tiesinis. Jei požymiai x ir y yra tiesiškai nepriklausomi, tai r x,y yra artimas 0.
Norėdami apskaičiuoti r x,y, taip pat galite naudoti 1 lentelę.

1 lentelė

N pastebėjimųx iy ix i ∙y i
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
nx ny nx n y n
Stulpelio suma∑x∑y∑xy
Vidutinė vertė
Norėdami įvertinti gautos regresijos lygties kokybę, apskaičiuokite teorinį determinacijos koeficientą - R 2 yx:

,
čia d 2 yra y dispersija, paaiškinta regresijos lygtimi;
e 2 - liekamoji (nepaaiškinta regresijos lygtimi) y dispersija;
s 2 y – bendra (bendra) y dispersija.
Determinacijos koeficientas apibūdina gauto požymio y kitimo (dispersijos), paaiškinamo regresija (taigi ir veiksniu x), dalį bendroje variacijoje (dispersijoje) y. Determinacijos koeficientas R 2 yx įgauna reikšmes nuo 0 iki 1. Atitinkamai, reikšmė 1-R 2 yx apibūdina dispersijos y proporciją, kurią sukelia kitų faktorių, į kuriuos neatsižvelgta modelio ir specifikacijos klaidų, įtakos.
Su porine tiesine regresija R 2 yx = r 2 yx.

Mažiausių kvadratų metodas yra matematinė procedūra, skirta sudaryti tiesinę lygtį, kuri geriausiai atitinka sutvarkytų porų rinkinį, ieškant a ir b reikšmių, koeficientų tiesės lygtyje. Mažiausių kvadratų tikslas yra sumažinti bendrą kvadrato paklaidą tarp y ir ŷ reikšmių. Jei kiekvienam taškui nustatome paklaidą ŷ, mažiausių kvadratų metodas sumažina:

kur n = tvarkingų porų skaičius aplink liniją. kuo arčiau duomenų.

Ši koncepcija pavaizduota paveikslėlyje

Remiantis paveikslėliu, linija, kuri geriausiai atitinka duomenis, regresijos linija, sumažina bendrą keturių grafiko taškų kvadratinę paklaidą. Toliau pateiktame pavyzdyje parodysiu, kaip tai nustatyti naudojant mažiausius kvadratus.

Įsivaizduokite jauną porą, kuri neseniai persikėlė kartu ir dalijasi kosmetiniu stalu vonios kambaryje. Jaunuolis ėmė pastebėti, kad pusė jo stalo nenumaldomai mažėja, nusileidžia plaukų putoms ir sojų kompleksams. Per pastaruosius kelis mėnesius vaikinas atidžiai stebėjo, kaip daugėja objektų jos pusėje nuo stalo. Žemiau esančioje lentelėje parodytas per pastaruosius kelis mėnesius susikaupusių daiktų skaičius ant merginos vonios praustuvo.

Kadangi mūsų tikslas yra išsiaiškinti, ar prekių skaičius laikui bėgant didėja, „Mėnuo“ bus nepriklausomas kintamasis, o „Prekių skaičius“ – priklausomas kintamasis.

Naudodami mažiausių kvadratų metodą, apskaičiuojame a reikšmes, y kirtimo tašką ir b, linijos nuolydį, nustatome lygtį, kuri geriausiai atitinka duomenis:

a = y vid. – bx vid

čia x avg – nepriklausomo kintamojo x vidutinė reikšmė, y avg – vidutinė nepriklausomo kintamojo y reikšmė.

Žemiau esančioje lentelėje apibendrinami šioms lygtims reikalingi skaičiavimai.

Mūsų vonios pavyzdžio efekto kreivė būtų pateikta pagal šią lygtį:

Kadangi mūsų lygtis turi teigiamą 0,976 nuolydį, vaikinas turi įrodymų, kad daiktų skaičius ant stalo laikui bėgant didėja vidutiniškai po 1 prekę per mėnesį. Grafike parodyta efekto kreivė su išdėstytomis poromis.

Numatomas prekių skaičius per ateinančius šešis mėnesius (16 mėn.) bus apskaičiuojamas taip:

ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 elementas

Taigi, laikas mūsų herojui imtis kokių nors veiksmų.

Funkcija TREND programoje Excel

Kaip tikriausiai jau atspėjote, „Excel“ turi funkciją, skirtą reikšmėms apskaičiuoti mažiausių kvadratų metodas.Ši funkcija vadinama TREND. Jo sintaksė yra tokia:

TREND (žinomos Y reikšmės; žinomos X reikšmės; naujos X reikšmės; konstanta)

žinomos Y reikšmės – priklausomų kintamųjų masyvas, mūsų atveju objektų skaičius lentelėje

žinomos reikšmės X – nepriklausomų kintamųjų masyvas, mūsų atveju tai yra mėnuo

naujos X reikšmės – naujos X reikšmės (mėnesiai), kurioms TREND funkcija grąžina tikėtiną priklausomų kintamųjų reikšmę (elementų skaičių)

const – neprivaloma. Būlio reikšmė, nurodanti, ar konstanta b turi būti 0.

Pavyzdžiui, paveikslėlyje parodyta funkcija TREND, naudojama norint nustatyti numatomą 16-ojo mėnesio vonios kambario spintelės daiktų skaičių.

Jei tam tikras fizikinis dydis priklauso nuo kito dydžio, tada šią priklausomybę galima ištirti išmatuojant y esant skirtingoms x reikšmėms. Atlikus matavimus gaunama keletas verčių:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Remiantis tokio eksperimento duomenimis, galima sudaryti priklausomybės y = ƒ(x) grafiką. Gauta kreivė leidžia spręsti apie funkcijos ƒ(x) formą. Tačiau pastovūs koeficientai, kurie patenka į šią funkciją, lieka nežinomi. Juos galima nustatyti mažiausių kvadratų metodu. Eksperimentiniai taškai, kaip taisyklė, nėra tiksliai ant kreivės. Mažiausių kvadratų metodas reikalauja, kad eksperimentinių taškų nuokrypių nuo kreivės kvadratų suma, t.y. 2 buvo mažiausias.

Praktikoje šis metodas dažniausiai (ir paprasčiausiai) naudojamas tiesinio ryšio atveju, t.y. Kada

y = kx arba y = a + bx.

Tiesinė priklausomybė fizikoje yra labai paplitusi. Ir net kai ryšys yra netiesinis, jie paprastai bando sudaryti grafiką, kad gautų tiesią liniją. Pavyzdžiui, jei daroma prielaida, kad stiklo lūžio rodiklis n yra susijęs su šviesos bangos ilgiu λ ryšiu n = a + b/λ 2, tai n priklausomybė nuo λ -2 vaizduojama grafike.

Apsvarstykite priklausomybę y = kx(tiesi linija, einanti per pradžią). Sudarykime reikšmę φ mūsų taškų nuokrypių nuo tiesės kvadratų sumą

φ reikšmė visada yra teigiama ir pasirodo mažesnė, kuo mūsų taškai yra arčiau tiesės. Mažiausių kvadratų metodas teigia, kad k reikšmė turi būti parinkta taip, kad φ būtų minimali


arba
(19)

Skaičiavimas rodo, kad vidutinė kvadratinė paklaida nustatant k reikšmę yra lygi

, (20)
kur n yra matavimų skaičius.

Dabar panagrinėkime šiek tiek sunkesnį atvejį, kai taškai turi atitikti formulę y = a + bx(tiesi linija, nekertanti per pradžią).

Užduotis yra rasti geriausias a ir b reikšmes iš turimos reikšmių rinkinio x i, y i.

Dar kartą sudarykime kvadratinę formą φ, lygią taškų x i, y i nuokrypių nuo tiesės kvadratų sumai.

ir raskite a ir b reikšmes, kurių φ turi minimumą

;

.

.

Bendras šių lygčių sprendimas duoda

(21)

A ir b nustatymo vidutinės kvadratinės paklaidos yra lygios

(23)

.  (24)

Apdorojant matavimo rezultatus šiuo metodu, patogu visus duomenis apibendrinti lentelėje, kurioje preliminariai suskaičiuotos visos sumos, įtrauktos į (19)(24) formules. Šių lentelių formos pateiktos toliau pateiktuose pavyzdžiuose.

1 pavyzdys. Ištirta pagrindinė sukamojo judėjimo dinamikos lygtis ε = M/J (tiesė, einanti per pradžią). Esant skirtingoms momento M reikšmėms, buvo išmatuotas tam tikro kūno kampinis pagreitis ε. Būtina nustatyti šio kūno inercijos momentą. Jėgos momento ir kampinio pagreičio matavimų rezultatai pateikiami antrame ir trečiame stulpeliuose 5 lentelė.

5 lentelė
n M, N m ε, s -1 M 2 M ε ε - kM (ε – kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Naudodami (19) formulę nustatome:

.

Norėdami nustatyti vidutinę kvadratinę paklaidą, naudojame formulę (20)

0.005775kilogramas-1 · m -2 .

Pagal (18) formulę turime

; .

S J = (2,996 0,005775) / 0,3337 = 0,05185 kg m2.

Nustačius patikimumą P = 0,95, naudodamiesi Stjudento koeficientų lentele, kai n = 5, randame t = 2,78 ir nustatome absoliučią paklaidą ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Rezultatus parašykime formoje:

J = (3,0 ± 0,2) kg m2;


2 pavyzdys. Apskaičiuokime metalo varžos temperatūros koeficientą mažiausių kvadratų metodu. Atsparumas tiesiškai priklauso nuo temperatūros

Rt = R 0 (1 + α t°) = R 0 + R 0 α t°.

Laisvasis terminas nustato varžą R 0 esant 0 ° C temperatūrai, o nuolydžio koeficientas yra temperatūros koeficiento α ir varžos R 0 sandauga.

Matavimų ir skaičiavimų rezultatai pateikti lentelėje ( žr. 6 lentelę).

6 lentelė
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Naudodami (21), (22) formules nustatome

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Om.

Raskime α apibrėžimo klaidą. Nuo tada pagal (18) formulę turime:

.

Naudodami (23), (24) formules turime

;

0.014126 Om.

Nustačius patikimumą P = 0,95, naudodamiesi Stjudento koeficientų lentele, kai n = 6, randame t = 2,57 ir nustatome absoliučią paklaidą Δα = 2,57 0,000132 = 0,000338 laipsnis -1.

α = (23 ± 4) 10 -4 kruša-1, kai P = 0,95.


3 pavyzdys. Būtina nustatyti lęšio kreivio spindulį naudojant Niutono žiedus. Išmatuoti Niutono žiedų spinduliai r m ir nustatyti šių žiedų skaičiai m. Niutono žiedų spindulys yra susijęs su lęšio kreivio spinduliu R ir žiedo skaičiumi pagal lygtį

r 2 m = mλR - 2d 0 R,

kur d 0 tarpo tarp lęšio ir plokštumos lygiagrečios plokštės storis (arba lęšio deformacija),

λ krintančios šviesos bangos ilgis.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

tada lygtis įgaus formą y = a + bx.

.

Įvedami matavimų ir skaičiavimų rezultatai 7 lentelė.

7 lentelė
n x = m y = r 2, 10 -2 mm 2 m -¯ m (m–¯m) 2 (m -¯ m) m y - bx - a, 10 -4 (y – bx – a) 2 , 10 –6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Paprastųjų mažiausių kvadratų (OLS) metodas- matematinis metodas, naudojamas įvairiems uždaviniams spręsti, pagrįstas tam tikrų funkcijų kvadratinių nuokrypių nuo norimų kintamųjų sumos sumažinimu. Jis gali būti naudojamas „išspręsti“ per daug apibrėžtas lygčių sistemas (kai lygčių skaičius viršija nežinomųjų skaičių), ieškant sprendinių įprastų (ne per daug apibrėžtų) netiesinių lygčių sistemų atveju, apytiksliai apytiksliai kai kurių lygčių reikšmes. funkcija. OLS yra vienas iš pagrindinių regresinės analizės metodų, leidžiančių įvertinti nežinomus regresijos modelių parametrus iš imties duomenų.

Enciklopedinis „YouTube“.

    1 / 5

    ✪ Mažiausių kvadratų metodas. Tema

    ✪ Mažiausių kvadratų metodas, pamoka 1/2. Linijinė funkcija

    ✪ Ekonometrija. 5 paskaita. Mažiausių kvadratų metodas

    ✪ Mitin I.V. – fizinių rezultatų apdorojimas. eksperimentas – Mažiausių kvadratų metodas (4 paskaita)

    ✪ Ekonometrija: 2 mažiausių kvadratų metodo esmė

    Subtitrai

Istorija

Iki XIX amžiaus pradžios. mokslininkai neturėjo tam tikrų taisyklių, kaip išspręsti lygčių sistemą, kurioje nežinomųjų skaičius yra mažesnis už lygčių skaičių; Iki tol buvo naudojamos privačios technikos, kurios priklausė nuo lygčių tipo ir skaičiuoklių sąmojingumo, todėl skirtingi skaičiuotuvai, remdamiesi tais pačiais stebėjimų duomenimis, priėjo prie skirtingų išvadų. Gaussas (1795) pirmasis panaudojo metodą, o Legendre (1805) savarankiškai atrado ir paskelbė jį šiuolaikiniu pavadinimu (prancūzų k.). Méthode des moindres quarrés). Laplasas šį metodą susiejo su tikimybių teorija, o amerikiečių matematikas Adrainas (1808) svarstė jo tikimybių teorinius pritaikymus. Metodas buvo plačiai paplitęs ir patobulintas tolesnių Encke, Besselio, Hanseno ir kitų tyrimų.

Mažiausių kvadratų metodo esmė

Leisti x (\displaystyle x)- rinkinys n (\displaystyle n) nežinomi kintamieji (parametrai), f i (x) (\displaystyle f_(i)(x)), , m > n (\displaystyle m>n)- funkcijų rinkinys iš šio kintamųjų rinkinio. Užduotis yra pasirinkti tokias reikšmes x (\displaystyle x), kad šių funkcijų reikšmės būtų kuo artimesnės tam tikroms reikšmėms y i (\displaystyle y_(i)). Iš esmės mes kalbame apie per daug apibrėžtos lygčių sistemos „sprendimą“. f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\displaystyle i=1,\ldots ,m) nurodyta didžiausio kairiosios ir dešiniosios sistemos dalių artumo prasme. Mažiausių kvadratų metodo esmė yra pasirinkti kaip „artumo matą“ kairiosios ir dešiniosios kraštinių nuokrypių kvadratų sumą. | f i (x) − y i | (\displaystyle |f_(i)(x)-y_(i)|). Taigi MNC esmė gali būti išreikšta taip:

∑ i e i 2 = ∑ i (y i − f i (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\rodyklė dešinėn \min _(x)).

Jei lygčių sistema turi sprendinį, tai kvadratų sumos minimumas bus lygus nuliui ir tikslius lygčių sistemos sprendinius galima rasti analitiškai arba, pavyzdžiui, naudojant įvairius skaitinio optimizavimo metodus. Jei sistema yra per daug apibrėžta, tai yra, laisvai kalbant, nepriklausomų lygčių skaičius yra didesnis nei norimų kintamųjų skaičius, tada sistema neturi tikslaus sprendimo ir mažiausių kvadratų metodas leidžia rasti kokį nors „optimalų“ vektorių. x (\displaystyle x) maksimalaus vektorių artumo prasme y (\displaystyle y) Ir f (x) (\displaystyle f(x)) arba maksimalus nuokrypio vektoriaus artumas e (\displaystyle e) iki nulio (artumas suprantamas euklido nuotolio prasme).

Pavyzdys – tiesinių lygčių sistema

Visų pirma, mažiausių kvadratų metodas gali būti naudojamas tiesinių lygčių sistemai „išspręsti“.

A x = b (\displaystyle Ax=b),

Kur A (\displaystyle A) stačiakampio dydžio matrica m × n , m > n (\displaystyle m\times n,m>n)(t.y. matricos A eilučių skaičius yra didesnis nei ieškomų kintamųjų).

Bendruoju atveju tokia lygčių sistema neturi sprendimo. Todėl šią sistemą galima „išspręsti“ tik pasirinkus tokį vektorių x (\displaystyle x) sumažinti „atstumą“ tarp vektorių A x (\displaystyle Ax) Ir b (\displaystyle b). Norėdami tai padaryti, galite taikyti sistemos lygčių kairiosios ir dešiniosios pusės skirtumų kvadratų sumos sumažinimo kriterijų, ty (A x − b) T (A x − b) → min (\displaystyle (Ax-b)^(T)(Ax-b)\rodyklė dešinėn \min ). Nesunku parodyti, kad išsprendus šią minimalizavimo problemą galima išspręsti šią lygčių sistemą

A T A x = A T b ⇒ x = (AT A) − 1 A T b (\displaystyle A^(T)Ax=A^(T)b\Rodyklė dešinėn x=(A^(T)A)^(-1)A^ (T)b).

OLS regresinėje analizėje (apytikslis duomenų)

Tebūnie n (\displaystyle n) kai kurių kintamųjų reikšmės y (\displaystyle y)(tai gali būti stebėjimų, eksperimentų ir kt. rezultatai) ir susijusius kintamuosius x (\displaystyle x). Iššūkis yra užtikrinti, kad santykiai tarp y (\displaystyle y) Ir x (\displaystyle x) apytikslis pagal kokią nors žinomą funkciją kai kurių nežinomų parametrų ribose b (\displaystyle b) ty iš tikrųjų raskite geriausias parametrų vertes b (\displaystyle b), maksimaliai aproksimuojant reikšmes f (x, b) (\displaystyle f(x,b)) prie faktinių verčių y (\displaystyle y). Tiesą sakant, tai susiję su per daug apibrėžtos lygčių sistemos „išsprendimu“ b (\displaystyle b):

F (x t , b) = y t , t = 1 , … , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

Regresinėje analizėje ir ypač ekonometrijoje naudojami tikimybiniai kintamųjų priklausomybės modeliai.

Y t = f (x t , b) + ε t (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

Kur ε t (\displaystyle \varepsilon _(t))- taip vadinamas atsitiktinių klaidų modeliai.

Atitinkamai, stebimų verčių nuokrypiai y (\displaystyle y) iš modelio f (x, b) (\displaystyle f(x,b)) jau daroma prielaida pačiame modelyje. Mažiausių kvadratų metodo (paprastojo, klasikinio) esmė – rasti tokius parametrus b (\displaystyle b), kurioje nuokrypių kvadratų suma (klaidos, regresijos modeliams jos dažnai vadinamos regresijos likučiais) e t (\displaystyle e_(t)) bus minimalus:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\hat (b))_(OLS)=\arg \min _(b)RSS(b)),

Kur R S S (\displaystyle RSS)- Anglų Likutinė kvadratų suma apibrėžiama taip:

R S S (b) = e T e = ∑ t = 1 n e t 2 = ∑ t = 1 n (y t − f (x t , b)) 2 (\displaystyle RSS(b)=e^(T)e=\sum _ (t=1)^(n)e_(t)^(2)=\suma _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

Bendru atveju ši problema gali būti išspręsta skaitmeninio optimizavimo (miniminimo) metodais. Šiuo atveju jie kalba apie netiesiniai mažieji kvadratai(NLS arba NLLS – angl. Non-linear Least Squares). Daugeliu atvejų galima gauti analitinį sprendimą. Norint išspręsti minimizavimo problemą, reikia rasti stacionarius funkcijos taškus R S S (b) (\displaystyle RSS(b)), skiriant jį pagal nežinomus parametrus b (\displaystyle b), prilygindami išvestines nuliui ir išsprendę gautą lygčių sistemą:

∑ t = 1 n (y t − f (x t , b)) ∂ f (x t , b) ∂ b = 0 (\rodymo stilius \suma _(t=1)^(n)(y_(t)-f(x_) (t),b))(\frac (\partial f(x_(t),b))(\partial b))=0).

OLS tiesinės regresijos atveju

Tegul regresijos priklausomybė yra tiesinė:

y t = ∑ j = 1 k b j x t j + ε = x t T b + ε t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

Leisti y yra paaiškinamo kintamojo stebėjimų stulpelio vektorius ir X (\displaystyle X)- Tai (n × k) (\displaystyle ((n\times))))- faktorių stebėjimų matrica (matricos eilutės yra tam tikro stebėjimo faktorių reikšmių vektoriai, stulpeliai yra tam tikro faktoriaus reikšmių vektorius visuose stebėjimuose). Tiesinio modelio matricos vaizdavimas turi tokią formą:

y = X b + ε (\displaystyle y=Xb+\varepsilon ).

Tada paaiškinamo kintamojo įverčių vektorius ir regresijos likučių vektorius bus lygūs

y ^ = X b , e = y − y ^ = y − X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

Atitinkamai, regresijos likučių kvadratų suma bus lygi

R S S = e T e = (y − X b) T (y − X b) (\displaystyle RSS=e^(T)e=(y-Xb)^(T)(y-Xb)).

Šios funkcijos diferencijavimas pagal parametrų vektorių b (\displaystyle b) o išvestines prilyginus nuliui, gauname lygčių sistemą (matricos pavidalu):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

Iššifruotoje matricos formoje ši lygčių sistema atrodo taip:

(∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x x t 2 x t 3 k 3 x t 3 … ∑ ∑ x t 3 x t 2 ∑ x t 3 2 … ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2 ∑ x t k 2) ( ∑ x t k 2) ∑ x t 2 y t ∑ x t 3 y t ⋮ ∑ x t k y t) , (\displaystyle (\begin(pmatrix)\sum x_(t1)^(2)&\sum x_(t1)x_(t2)&\sum x_(t1)x_(t3)&\ldots &\suma x_(t1)x_(tk)\\\suma x_(t2)x_(t1)&\suma x_(t2)^(2)&\suma x_(t2)x_(t3)&\ltaškai &\ suma x_(t2)x_(tk)\\\suma x_(t3)x_(t1)&\suma x_(t3)x_(t2)&\suma x_(t3)^(2)&\ltaškai &\suma x_ (t3)x_(tk)\\\vtaškai &\vtaškai &\vtaškai &\dtaškai &\vtaškai \\\sum x_(tk)x_(t1)&\sum x_(tk)x_(t2)&\sum x_ (tk)x_(t3)&\ltaškai &\sum x_(tk)^(2)\\\end(pmatrica))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vdots \\b_(k)\\\end(pmatrix))=(\begin(pmatrix)\sum x_(t1)y_(t)\\\sum x_(t2)y_(t)\\ \sum x_(t3)y_(t)\\\vtaškai \\\sum x_(tk)y_(t)\\\end(pmatrica)),) kur visos sumos perimamos per visas galiojančias reikšmes t (\displaystyle t).

Jei į modelį įtraukta konstanta (kaip įprasta), tada x t 1 = 1 (\displaystyle x_(t1) = 1) visų akivaizdoje t (\displaystyle t), todėl lygčių sistemos matricos viršutiniame kairiajame kampe yra stebėjimų skaičius n (\displaystyle n), o likusiuose pirmosios eilutės ir pirmojo stulpelio elementuose - tiesiog kintamųjų reikšmių sumos: ∑ x t j (\displaystyle \sum x_(tj)) o pirmasis dešiniosios sistemos pusės elementas yra ∑ y t (\displaystyle \sum y_(t)).

Šios lygčių sistemos sprendimas pateikia bendrą tiesinio modelio mažiausių kvadratų įverčių formulę:

b ^ O L S = (X T X) − 1 X T y = (1 n X T X) − 1 1 n X T y = V x − 1 C x y (\displaystyle (\hat (b))_(OLS)=(X^(T) )X)^(-1)X^(T)y=\left((\frac (1)(n))X^(T)X\right)^(-1)(\frac (1)(n ))X^(T)y=V_(x)^(-1)C_(xy)).

Analitiniais tikslais naudingas paskutinis šios formulės atvaizdas (lygčių sistemoje dalinant iš n vietoj sumų atsiranda aritmetiniai vidurkiai). Jei regresijos modelyje duomenys centre, tada šiame vaizde pirmoji matrica turi imties faktorių kovariacijos matricos reikšmę, o antroji yra faktorių kovariacijų vektorius su priklausomu kintamuoju. Jei papildomai duomenys taip pat normalizuotasį MSE (tai yra galiausiai standartizuoti), tada pirmoji matrica turi veiksnių imties koreliacijos matricos reikšmę, antrasis vektorius - veiksnių imties koreliacijų vektorius su priklausomu kintamuoju.

Svarbi modelių OLS įverčių savybė su pastoviu- sudarytos regresijos linija eina per imties duomenų svorio centrą, tai yra, lygybė yra įvykdyta:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x ¯ j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\hat (b))_(j)(\bar (x))_(j)).

Ypač kraštutiniu atveju, kai vienintelis regresorius yra konstanta, nustatome, kad vienintelio parametro (pačios konstantos) OLS įvertis yra lygus vidutinei paaiškinamo kintamojo vertei. Tai yra, aritmetinis vidurkis, žinomas dėl savo gerųjų savybių iš didelių skaičių dėsnių, taip pat yra mažiausių kvadratų įvertis – jis atitinka minimalios kvadratinių nukrypimų nuo jo sumos kriterijų.

Paprasčiausi ypatingi atvejai

Porinės tiesinės regresijos atveju y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), įvertinus tiesinę vieno kintamojo priklausomybę nuo kito, skaičiavimo formulės supaprastinamos (galima apsieiti ir be matricinės algebros). Lygčių sistema turi tokią formą:

(1 x ¯ x ¯ x 2 ¯) (a b) = (y ¯ x y ¯) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar (x^(2)))\\\end(pmatrix))(\begin(pmatrix)a\\b\\\end(pmatrix))=(\begin(pmatrix)(\bar (y))\\ (\overline (xy))\\\end(pmatrix))).

Iš čia lengva rasti koeficientų įverčius:

( b ^ = Cov ⁡ (x , y) Var ⁡ (x) = x y ¯ − x ¯ y ¯ x 2 ¯ − x ¯ 2, a ^ = y ¯ − b x . (\displaystyle (\begin(cases)) (\hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline) (xy))-(\bar (x))(\bar (y)))((\overline (x^(2)))-(\overline (x))^(2))),\\( \hat (a))=(\bar (y))-b(\bar (x)).\end(atvejai)))

Nepaisant to, kad bendrais atvejais pirmenybė teikiama modeliams su konstanta, kai kuriais atvejais iš teorinių svarstymų žinoma, kad konstanta a (\displaystyle a) turi būti lygus nuliui. Pavyzdžiui, fizikoje įtampos ir srovės santykis yra U = I ⋅ R (\displaystyle U=I\cdot R); Matuojant įtampą ir srovę, būtina įvertinti varžą. Šiuo atveju kalbame apie modelį y = b x (\displaystyle y=bx). Šiuo atveju vietoj lygčių sistemos turime vieną lygtį

(∑ x t 2) b = ∑ x t y t (\displaystyle \left(\sum x_(t)^(2)\right)b=\sum x_(t)y_(t)).

Todėl vieno koeficiento įvertinimo formulė turi formą

B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t )y_(t))(\sum _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

Polinominio modelio atvejis

Jei duomenis atitinka vieno kintamojo daugianario regresijos funkcija f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), tada, suvokdamas laipsnius x i (\displaystyle x^(i)) kaip nepriklausomus veiksnius kiekvienam i (\displaystyle i) modelio parametrus galima įvertinti remiantis bendra tiesinio modelio parametrų įvertinimo formule. Norėdami tai padaryti, pakanka atsižvelgti į bendrąją formulę, kad su tokiu aiškinimu x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j)) Ir x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). Todėl matricos lygtys šiuo atveju bus tokios formos:

(n ∑ n x t … ∑ n x t k ∑ n x t ∑ n x t 2 … ∑ n x t k + 1 ⋮ ⋮ ⋱ ⋮ ∑ n x t k ∑ n x t k + 1 k ) [ b t k + 1 k ] = [ ∑ n y t ∑ n t y t ⋮ ∑ n x t k y t ] . (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\sum \limits _(n)x_(t)^(2)&\ldots &\sum \limits _(n)x_(t)^(k+1)\\\vtaškai & \vtaškai &\dtaškai &\vtaškai \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ltaškai &\ suma \limits _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vtaškai \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatrica)).

Statistinės OLS įverčių savybės

Visų pirma pažymime, kad tiesiniams modeliams OLS įverčiai yra tiesiniai įverčiai, kaip matyti iš aukščiau pateiktos formulės. Nešališkiems OLS įverčiams būtina ir pakanka įvykdyti svarbiausią regresinės analizės sąlygą: faktorinis-sąlyginis matematinis atsitiktinės paklaidos lūkestis turi būti lygus nuliui. Ši sąlyga visų pirma tenkinama, jei

  1. atsitiktinių klaidų matematinis lūkestis lygus nuliui, ir
  2. faktoriai ir atsitiktinės paklaidos yra nepriklausomi atsitiktiniai  kintamieji.

Antroji sąlyga – veiksnių egzogeniškumo sąlyga – yra esminė. Jei ši savybė nesilaikoma, galime manyti, kad beveik bet kokie įverčiai bus itin nepatenkinami: jie net nebus nuoseklūs (tai yra, net ir labai didelis duomenų kiekis neleidžia gauti kokybiškų įverčių šiuo atveju ). Klasikiniu atveju daroma stipresnė prielaida apie veiksnių determinizmą, o ne atsitiktinę paklaidą, kuri automatiškai reiškia, kad egzogeniškumo sąlyga yra įvykdyta. Bendru atveju, kad įverčiai būtų nuoseklūs, pakanka tenkinti egzogeniškumo sąlygą kartu su matricos konvergencija V x (\displaystyle V_(x))į kokią nors nevienetinę matricą, kai imties dydis didėja iki begalybės.

Kad, be nuoseklumo ir nešališkumo, (paprastųjų) mažiausių kvadratų įverčiai taip pat būtų veiksmingi (geriausi tiesinių nešališkų įverčių klasėje), turi būti įvykdytos papildomos atsitiktinės paklaidos savybės:

Šios prielaidos gali būti suformuluotos atsitiktinės paklaidos vektoriaus kovariacijos matricai V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I).

Šias sąlygas tenkinantis tiesinis modelis vadinamas klasikinis. Klasikinės tiesinės regresijos OLS įverčiai yra nešališki, nuoseklūs ir veiksmingiausi visų tiesinių nešališkų įverčių klasėje (anglų literatūroje santrumpa kartais vartojama MĖLYNA (Geriausias tiesinis nešališkas įvertinimo įrankis) – geriausias tiesinis nešališkas įvertis; Rusų literatūroje dažniau cituojama Gauso-Markovo teorema). Kaip nesunku parodyti, koeficientų įverčių vektoriaus kovariacijos matrica bus lygi:

V (b ^ O L S) = σ 2 (X T X) − 1 (\displaystyle V((\hat (b))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

Efektyvumas reiškia, kad ši kovariacijos matrica yra „minimali“ (bet koks tiesinis koeficientų derinys, o ypač patys koeficientai, turi minimalią dispersiją), tai yra, linijinių nešališkų įverčių klasėje geriausi yra OLS įverčiai. Šios matricos įstrižainės elementai – koeficientų įverčių dispersijos – yra svarbūs gautų įverčių kokybės parametrai. Tačiau kovariacijos matricos apskaičiuoti neįmanoma, nes atsitiktinės paklaidos dispersija nežinoma. Galima įrodyti, kad nešališkas ir nuoseklus (klasikiniam tiesiniam modeliui) atsitiktinių paklaidų dispersijos įvertis yra dydis:

S 2 = R S S / (n − k) (\displaystyle s^(2) = RSS/(n-k)).

Pakeitę šią reikšmę į kovariacijos matricos formulę, gauname kovariacijos matricos įvertį. Gauti įvertinimai taip pat yra nešališki ir nuoseklūs. Taip pat svarbu, kad paklaidos dispersijos įvertis (taigi ir koeficientų dispersija) ir modelio parametrų įverčiai būtų nepriklausomi atsitiktiniai dydžiai, todėl galima gauti testų statistiką hipotezėms apie modelio koeficientus tikrinti.

Reikėtų pažymėti, kad jei nesilaikoma klasikinių prielaidų, OLS parametrų įvertinimai nėra patys efektyviausi ir W (\displaystyle W) yra tam tikra simetriška teigiamo apibrėžtojo svorio matrica. Įprasti mažiausi kvadratai yra ypatingas šio metodo atvejis, kai svorio matrica yra proporcinga tapatybės matricai. Kaip žinoma, simetrinėms matricoms (arba operatoriams) yra išplėtimas W = P T P (\displaystyle W=P^(T)P). Todėl nurodytą funkciją galima pavaizduoti taip e T P T P e = (P e) T P e = e ∗ T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)) ty ši funkcija gali būti pavaizduota kaip kai kurių transformuotų „likučių“ kvadratų suma. Taigi galime išskirti mažiausių kvadratų metodų klasę – LS metodus (Least Squares).

Įrodyta (Aitkeno teorema), kad apibendrintam tiesinės regresijos modeliui (kuriame atsitiktinių paklaidų kovariacijos matricai netaikomi jokie apribojimai) efektyviausi (tiesinių nešališkų įverčių klasėje) yra vadinamieji įverčiai. apibendrinti mažiausių kvadratų (GLS – generalized Least Squares)- LS metodas su svorio matrica, lygia atsitiktinių klaidų atvirkštinei kovariacijos matricai: W = V ε − 1 (\displaystyle W=V_(\varepsilon )^(-1)).

Galima parodyti, kad tiesinio modelio parametrų GLS įverčių formulė turi formą

B ^ G L S = (X T V − 1 X) − 1 X T V − 1 y (\displaystyle (\hat (b))_(GLS)=(X^(T)V^(-1)X)^(-1) X^(T)V^(-1)y).

Šių įverčių kovariacijos matrica atitinkamai bus lygi

V (b ^ G L S) = (X T V − 1 X) − 1 (\displaystyle V((\hat (b))_(GLS))=(X^(T)V^(-1)X)^(- 1)).

Tiesą sakant, OLS esmė slypi tam tikroje (tiesinėje) pirminių duomenų transformacijoje (P) ir įprasto OLS pritaikyme transformuotiems duomenims. Šios transformacijos tikslas yra tas, kad transformuotų duomenų atsitiktinės paklaidos jau tenkintų klasikines prielaidas.

Svertinis OLS

Įstrižainės svorio matricos (taigi ir atsitiktinių paklaidų kovariacijos matricos) atveju turime taip vadinamą svertinį mažiausią kvadratą (WLS). Šiuo atveju modelio likučių kvadratų svertinė suma yra sumažinta, tai yra, kiekvienas stebėjimas gauna „svorį“, kuris yra atvirkščiai proporcingas šio stebėjimo atsitiktinės paklaidos dispersijai: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ sigma_(t)^(2)))). Tiesą sakant, duomenys transformuojami pasveriant stebėjimus (padalijus iš sumos, proporcingos apskaičiuotam atsitiktinių klaidų standartiniam nuokrypiui), o svertiniams duomenims taikomas įprastas OLS.

ISBN 978-5-7749-0473-0 .

  • Ekonometrija. Vadovėlis / Red. Eliseeva I.I. – 2 leidimas. - M.: Finansai ir statistika, 2006. - 576 p. - ISBN 5-279-02786-3.
  • Aleksandrova N.V. Matematikos terminų, sąvokų, užrašų istorija: žodynas-žinynas. - 3 leidimas - M.: LKI, 2008. - 248 p. - ISBN 978-5-382-00839-4. I.V. Mitinas, Rusakovas V.S. Eksperimentinių duomenų analizė ir apdorojimas - 5 leidimas - 24 p.
  • Jis turi daugybę programų, nes leidžia apytiksliai pateikti tam tikrą funkciją kitomis paprastesnėmis. LSM gali būti labai naudingas apdorojant stebėjimus, ir jis aktyviai naudojamas kai kuriems dydžiams įvertinti remiantis kitų matavimų rezultatais, kuriuose yra atsitiktinių klaidų. Šiame straipsnyje sužinosite, kaip „Excel“ įdiegti mažiausiųjų kvadratų skaičiavimus.

    Problemos išdėstymas naudojant konkretų pavyzdį

    Tarkime, kad yra du rodikliai X ir Y. Be to, Y priklauso nuo X. Kadangi OLS mus domina regresinės analizės požiūriu (Excel jos metodai įgyvendinami naudojant įmontuotas funkcijas), turėtume nedelsiant pereiti prie specifinė problema.

    Taigi, tegul X yra bakalėjos parduotuvės prekybos plotas, matuojamas kvadratiniais metrais, o Y – metinė apyvarta, išreikšta milijonais rublių.

    Būtina numatyti, kokią apyvartą (Y) turės parduotuvė, jei joje bus tas ar kitas prekybos plotas. Akivaizdu, kad funkcija Y = f (X) didėja, nes prekybos centre parduodama daugiau prekių nei kioske.

    Keletas žodžių apie pradinių duomenų, naudojamų prognozavimui, teisingumą

    Tarkime, kad turime lentelę, sukurtą naudojant n parduotuvių duomenis.

    Matematinės statistikos duomenimis, rezultatai bus daugmaž teisingi, jei bus išnagrinėti bent 5-6 objektų duomenys. Be to, negalima naudoti „anomalių“ rezultatų. Visų pirma, elitinio mažo butiko apyvarta gali būti kelis kartus didesnė nei didelių „masmarket“ klasės mažmeninės prekybos vietų.

    Metodo esmė

    Lentelės duomenis galima pavaizduoti Dekarto plokštumoje taškų M 1 (x 1, y 1), ... M n (x n, y n) pavidalu. Dabar uždavinio sprendimas bus sumažintas iki aproksimacinės funkcijos y = f (x) parinkimo, kurios grafikas eina kuo arčiau taškų M 1, M 2, .. M n.

    Žinoma, galite naudoti aukšto laipsnio daugianarį, tačiau šią parinktį ne tik sunku įgyvendinti, bet ir tiesiog neteisinga, nes ji neatspindės pagrindinės tendencijos, kurią reikia aptikti. Racionaliausia išeitis – ieškoti tiesės y = ax + b, kuri geriausiai aproksimuoja eksperimentinius duomenis, tiksliau – koeficientus a ir b.

    Tikslumo įvertinimas

    Bet kokiu apytiksliu būdu ypač svarbu įvertinti jo tikslumą. Pažymėkime e i skirtumą (nuokrypį) tarp taško x i funkcinių ir eksperimentinių reikšmių, ty e i = y i - f (x i).

    Akivaizdu, kad norint įvertinti aproksimacijos tikslumą, galite naudoti nuokrypių sumą, t. suma e i visuose nagrinėjamuose taškuose. Tačiau ne viskas taip paprasta, nes kartu su teigiamais nukrypimais bus ir neigiamų.

    Problemą galima išspręsti naudojant nuokrypių modulius arba jų kvadratus. Paskutinis metodas yra plačiausiai naudojamas. Jis naudojamas daugelyje sričių, įskaitant regresinę analizę (programoje „Excel“ ji įgyvendinama naudojant dvi integruotas funkcijas), ir jau seniai įrodyta, kad yra veiksminga.

    Mažiausio kvadrato metodas

    Kaip žinote, „Excel“ turi įmontuotą funkciją „AutoSum“, leidžiančią apskaičiuoti visų reikšmių, esančių pasirinktame diapazone, reikšmes. Taigi niekas netrukdys mums apskaičiuoti išraiškos reikšmės (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

    Matematiniu užrašu tai atrodo taip:

    Kadangi iš pradžių buvo nuspręsta apytiksliai naudoti tiesią liniją, turime:

    Taigi, norint rasti tiesę, kuri geriausiai apibūdina specifinę dydžių X ir Y priklausomybę, reikia apskaičiuoti dviejų kintamųjų funkcijos minimumą:

    Norėdami tai padaryti, naujų kintamųjų a ir b dalines išvestis turite prilyginti nuliui ir išspręsti primityvią sistemą, susidedančią iš dviejų lygčių su 2 formos nežinomaisiais:

    Atlikę keletą paprastų transformacijų, įskaitant padalijimą iš 2 ir manipuliavimą sumomis, gauname:

    Ją išspręsdami, pavyzdžiui, Cramerio metodu, gauname stacionarų tašką su tam tikrais koeficientais a * ir b *. Tai yra minimumas, t.y., norint nuspėti, kokią apyvartą turės parduotuvė tam tikrame plote, tinka tiesė y = a * x + b *, kuri yra nagrinėjamo pavyzdžio regresijos modelis. Žinoma, tai neleis rasti tikslaus rezultato, tačiau padės susidaryti idėją, ar konkrečios srities pirkimas parduotuvės kreditu apsipirks.

    Kaip įdiegti mažiausią kvadratų skaičių „Excel“.

    „Excel“ turi funkciją, skirtą reikšmėms apskaičiuoti naudojant mažiausius kvadratus. Jis turi tokią formą: „TREND“ (žinomos Y reikšmės; žinomos X reikšmės; naujos X reikšmės; konstanta). Taikykime savo lentelei formulę, skirtą OLS skaičiavimui programoje „Excel“.

    Norėdami tai padaryti, įveskite „=“ ženklą langelyje, kuriame turėtų būti rodomas „Excel“ skaičiavimo, naudojant mažiausiųjų kvadratų metodą, rezultatas ir pasirinkite funkciją „TREND“. Atsidariusiame lange užpildykite atitinkamus laukus, pažymėdami:

    • žinomų Y verčių diapazonas (šiuo atveju prekybos apyvartos duomenys);
    • diapazonas x 1 , …x n , t. y. prekybos ploto dydis;
    • tiek žinomos, tiek nežinomos x reikšmės, kurioms reikia sužinoti apyvartos dydį (informaciją apie jų vietą darbalapyje žr. toliau).

    Be to, formulėje yra loginis kintamasis „Const“. Jei į atitinkamą lauką įvesite 1, tai reikš, kad turėtumėte atlikti skaičiavimus, darant prielaidą, kad b = 0.

    Jei reikia sužinoti daugiau nei vienos x reikšmės prognozę, tada įvedus formulę nereikėtų spausti „Enter“, o klaviatūroje reikia įvesti kombinaciją „Shift“ + „Control“ + „Enter“.

    Kai kurios funkcijos

    Regresinė analizė gali būti prieinama net manekenams. „Excel“ formulė, skirta numatyti nežinomų kintamųjų masyvo reikšmę – TREND – gali būti naudojama net tiems, kurie niekada negirdėjo apie mažiausius kvadratus. Pakanka tik žinoti kai kurias jo darbo ypatybes. Visų pirma:

    • Jei vienoje eilutėje ar stulpelyje išdėstysite žinomų kintamojo y reikšmių diapazoną, kiekviena eilutė (stulpelis) su žinomomis x reikšmėmis bus suvokiama kaip atskiras kintamasis.
    • Jei diapazonas su žinomu x nenurodytas lange TREND, tada naudojant funkciją Excel, programa jį traktuos kaip masyvą, susidedantį iš sveikųjų skaičių, kurių skaičius atitinka diapazoną su nurodytomis vertėmis. kintamasis y.
    • Norint išvesti „numatytų“ reikšmių masyvą, tendencijos skaičiavimo išraiška turi būti įvesta kaip masyvo formulė.
    • Jei naujos x reikšmės nenurodomos, funkcija TREND laiko jas lygiomis žinomoms. Jei jie nenurodyti, 1 masyvas laikomas argumentu; 2; 3; 4;…, kuris yra proporcingas diapazonui su jau nurodytais parametrais y.
    • Diapazonas, kuriame yra naujos x reikšmės, turi turėti tokias pačias ar daugiau eilučių arba stulpelių kaip ir diapazonas, kuriame yra nurodytos y reikšmės. Kitaip tariant, jis turi būti proporcingas nepriklausomiems kintamiesiems.
    • Masyve su žinomomis x reikšmėmis gali būti keli kintamieji. Tačiau jei mes kalbame tik apie vieną, tada reikalaujama, kad diapazonai su nurodytomis x ir y reikšmėmis būtų proporcingi. Jei yra keli kintamieji, būtina, kad diapazonas su nurodytomis y reikšmėmis tilptų į vieną stulpelį arba vieną eilutę.

    PRODUKTO funkcija

    Įdiegta naudojant kelias funkcijas. Vienas iš jų vadinasi „PROGNAVIMAS“. Jis panašus į „TREND“, ty pateikia skaičiavimų, naudojant mažiausių kvadratų metodą, rezultatą. Tačiau tik vienam X, kurio Y reikšmė nežinoma.

    Dabar jūs žinote „Excel“ formules, skirtas manekenams, kurios leidžia numatyti būsimą konkretaus rodiklio reikšmę pagal tiesinę tendenciją.