Interval spoľahlivosti. Čo to je a ako sa to dá použiť? Presnosť odhadu, úroveň spoľahlivosti (spoľahlivosť)

Presnosť odhadu, úroveň spoľahlivosti (spoľahlivosť)

Interval spoľahlivosti

Pri odbere malého objemu by sa mali použiť intervalové odhady, pretože na rozdiel od bodových odhadov sa tým predíde hrubým chybám.

Interval je odhad, ktorý je určený dvoma číslami - koncami intervalu pokrývajúceho odhadovaný parameter. Intervalové odhady nám umožňujú stanoviť presnosť a spoľahlivosť odhadov.

Nech štatistická charakteristika * zistená z údajov vzorky slúži ako odhad neznámeho parametra. Budeme to považovať za konštantné číslo (možno náhodnú premennú). Je zrejmé, že * čím presnejšie určuje parameter b, tým menšia je absolútna hodnota rozdielu | - * |. Inými slovami, ak >0 a | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Štatistické metódy nám však neumožňujú kategoricky tvrdiť, že odhad * spĺňa nerovnosť | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Spoľahlivosť (pravdepodobnosť spoľahlivosti) odhadu podľa * je pravdepodobnosť, s ktorou sa nerovnosť realizuje | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Nech je pravdepodobnosť, že | - *|<, равна т.е.

Nahradenie nerovnosti | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

R(*-< <*+)=.

Interval spoľahlivosti (*-, *+) sa nazýva interval spoľahlivosti, ktorý pokrýva neznámy parameter s danou spoľahlivosťou.

Intervaly spoľahlivosti na odhad matematického očakávania normálneho rozdelenia pri známom rozdelení.

Intervalový odhad so spoľahlivosťou matematického očakávania a normálne rozloženej kvantitatívnej charakteristiky X na základe priemeru vzorky x so známou smerodajnou odchýlkou ​​populácie je interval spoľahlivosti

x – t(/n^?)< a < х + t(/n^?),

kde t(/n^?)= je presnosť odhadu, n je veľkosť vzorky, t je hodnota argumentu Laplaceovej funkcie Ф(t), pri ktorej Ф(t)=/2.

Z rovnosti t(/n^?)= možno vyvodiť tieto závery:

1. keď sa veľkosť vzorky n zvyšuje, počet klesá, a preto sa zvyšuje presnosť odhadu;

2. zvýšenie spoľahlivosti odhadu = 2Ф(t) vedie k zvýšeniu t (Ф(t) je rastúca funkcia), a teda k zvýšeniu; inými slovami, zvýšenie spoľahlivosti klasického odhadu znamená zníženie jeho presnosti.

Príklad. Náhodná premenná X má normálne rozdelenie so známou smerodajnou odchýlkou ​​=3. Nájdite intervaly spoľahlivosti pre odhad neznámeho matematického očakávania a na základe priemeru vzorky x, ak veľkosť vzorky je n = 36 a spoľahlivosť odhadu je daná = 0,95.

Riešenie. Nájdime t. Zo vzťahu 2Ф(t) = 0,95 dostaneme Ф(t) = 0,475. Z tabuľky zistíme t=1,96.

Poďme zistiť presnosť odhadu:

presnosť merania intervalu spoľahlivosti

T(/n^?)= (1,96,3)//36 = 0,98.

Interval spoľahlivosti je: (x - 0,98; x + 0,98). Napríklad, ak x = 4,1, potom má interval spoľahlivosti nasledujúce hranice spoľahlivosti:

x - 0,98 = 4,1 - 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Hodnoty neznámeho parametra a teda v súlade s údajmi vzorky spĺňajú nerovnosť 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Vysvetlime si význam danej spoľahlivosti. Spoľahlivosť = 0,95 znamená, že ak sa odoberie dostatočne veľký počet vzoriek, potom 95 % z nich určí intervaly spoľahlivosti, v ktorých sa parameter skutočne nachádza; iba v 5 % prípadov môže prekročiť interval spoľahlivosti.

Ak je potrebné odhadnúť matematické očakávanie s vopred stanovenou presnosťou a spoľahlivosťou, potom sa minimálna veľkosť vzorky, ktorá zabezpečí túto presnosť, nájde pomocou vzorca

Intervaly spoľahlivosti na odhad matematického očakávania normálneho rozdelenia s neznámou

Intervalový odhad so spoľahlivosťou matematického očakávania a normálne rozloženej kvantitatívnej charakteristiky X na základe priemeru vzorky x s neznámou smerodajnou odchýlkou ​​populácie je interval spoľahlivosti

x - t()(s/n^?)< a < х + t()(s/n^?),

kde s je „opravená“ štandardná odchýlka vzorky, t() sa zistí z tabuľky pre dané a n.

Príklad. Kvantitatívna charakteristika X populácie je normálne rozložená. Na základe veľkosti vzorky n=16 bol zistený priemer vzorky x = 20,2 a „korigovaná“ smerodajná odchýlka s = 0,8. Odhadnite neznáme matematické očakávanie pomocou intervalu spoľahlivosti so spoľahlivosťou 0,95.

Riešenie. Poďme nájsť t(). Pomocou tabuľky pri = 0,95 an=16 nájdeme t()=2,13.

Poďme nájsť hranice spoľahlivosti:

x - t() (s/n^?) = 20,2 - 2,13 *. 0,8/16^? = 19,774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20,626

Takže so spoľahlivosťou 0,95 je neznámy parameter a obsiahnutý v intervale spoľahlivosti 19,774< а < 20,626

Odhad skutočnej hodnoty meranej veličiny

Nech sa vykoná n nezávislých rovnako presných meraní nejakej fyzikálnej veličiny, ktorej skutočná hodnota nie je známa.

Výsledky jednotlivých meraní budeme považovať za náhodné veličiny Хl, Х2,…Хn. Tieto veličiny sú nezávislé (merania sú nezávislé). Majú rovnaké matematické očakávanie a (skutočná hodnota meranej veličiny), rovnaké rozptyly ^2 (merania sú rovnako presné) a sú rozdelené normálne (tento predpoklad je potvrdený skúsenosťou).

Tým sú splnené všetky predpoklady, ktoré boli urobené pri odvodzovaní intervalov spoľahlivosti, a preto môžeme použiť vzorce. Inými slovami, skutočnú hodnotu nameranej hodnoty možno odhadnúť z aritmetického priemeru výsledkov jednotlivých meraní pomocou intervalov spoľahlivosti.

Príklad. Na základe údajov z deviatich nezávislých rovnako presných meraní fyzikálnej veličiny bol zistený aritmetický priemer výsledkov jednotlivých meraní x = 42,319 a „korigovaná“ smerodajná odchýlka s = 5,0. Je potrebné odhadnúť skutočnú hodnotu nameranej hodnoty so spoľahlivosťou = 0,95.

Riešenie. Skutočná hodnota meranej veličiny sa rovná jej matematickému očakávaniu. Problém preto spočíva v odhade matematického očakávania (za predpokladu, že je neznáma) pomocou intervalu spoľahlivosti pokrývajúceho a s danou spoľahlivosťou = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Pomocou tabuľky pomocou y = 0,95 a l = 9 zistíme

Poďme zistiť presnosť odhadu:

t())(s/n^?) = 2,31 * 5/9^? = 3,85

Poďme nájsť hranice spoľahlivosti:

x - t() (s/n^?) = 42,319 - 3,85 = 38,469;

x + t() (s/n^?) = 42,319 + 3,85 = 46,169.

Takže so spoľahlivosťou 0,95 skutočná hodnota nameranej hodnoty leží v intervale spoľahlivosti 38,469< а < 46,169.

Intervaly spoľahlivosti na odhad štandardnej odchýlky normálneho rozdelenia.

Nech je kvantitatívna charakteristika X všeobecnej populácie rozdelená normálne. Je potrebné odhadnúť neznámu všeobecnú smerodajnú odchýlku od „opravenej“ vzorovej smerodajnej odchýlky s. Na tento účel použijeme intervalový odhad.

Intervalový odhad (so spoľahlivosťou) štandardnej odchýlky o normálne rozloženej kvantitatívnej charakteristiky X založený na „opravenej“ štandardnej odchýlke vzorky s je interval spoľahlivosti

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

kde q sa zistí z tabuľky pre dané n n.

Príklad 1. Kvantitatívna charakteristika X všeobecnej populácie je rozdelená normálne. Na základe veľkosti vzorky n = 25 bola zistená „korigovaná“ smerodajná odchýlka s = 0,8. Nájdite interval spoľahlivosti pokrývajúci všeobecnú štandardnú odchýlku so spoľahlivosťou 0,95.

Riešenie. Pomocou tabuľky s údajmi = 0,95 an = 25 zistíme q = 0,32.

Požadovaný interval spoľahlivosti s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Príklad 2. Kvantitatívna charakteristika X všeobecnej populácie je rozdelená normálne. Na základe veľkosti vzorky n=10 bola zistená „korigovaná“ štandardná odchýlka s = 0,16. Nájdite interval spoľahlivosti pokrývajúci všeobecnú štandardnú odchýlku so spoľahlivosťou 0,999.

Riešenie. Pomocou dodatkovej tabuľky na základe údajov = 0,999 an=10 nájdeme 17= 1,80 (q > 1). Požadovaný interval spoľahlivosti je:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

stupňa presnosť merania

V teórii chýb je zvykom charakterizovať presnosť merania (presnosť prístroja) pomocou štandardnej odchýlky náhodných chýb merania. Na vyhodnotenie sa používa „opravená“ smerodajná odchýlka s. Keďže výsledky meraní sú zvyčajne vzájomne nezávislé, majú rovnaké matematické očakávanie (skutočná hodnota nameranej hodnoty) a rovnaký rozptyl (v prípade meraní s rovnakou presnosťou), na posúdenie merania je použiteľná teória načrtnutá v predchádzajúcom odseku. presnosť meraní.

Príklad. Na základe 15 meraní s rovnakou presnosťou bola zistená „korigovaná“ smerodajná odchýlka s = 0,12. Zistite presnosť merania so spoľahlivosťou 0,99.

Riešenie. Presnosť merania je charakterizovaná štandardnou odchýlkou ​​náhodných chýb, takže problém spočíva v nájdení intervalu spoľahlivosti s (1 -- q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

Použitím dodatkovej tabuľky pre = 0,99 an = 15 nájdeme q = 0,73.

Požadovaný interval spoľahlivosti

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Odhad pravdepodobnosti (binomické rozdelenie) z relatívnej frekvencie

Intervalový odhad (so spoľahlivosťou) neznámej pravdepodobnosti p binomického rozdelenia podľa relatívnej frekvencie w je interval spoľahlivosti (s približnými koncami p1 a p2)

p1< p < p2,

kde n je celkový počet testov; m je počet výskytov udalosti; w - relatívna frekvencia rovná pomeru m/n; t je hodnota argumentu Laplaceovej funkcie, pri ktorej Ф(t) = /2.

Komentujte. Pre veľké hodnoty n (rádovo stovky) možno považovať za približné hranice intervalu spoľahlivosti

Predtým sme uvažovali o určení pravdepodobnosti spoľahlivosti pre samostatné meranie X i pomocou tabuľky. 1.1, teda určenie pravdepodobnosti, že sa X i nebude odchyľovať od skutočnej hodnoty o viac ako ΔX.

Najdôležitejšou úlohou je však určiť veľkosť odchýlky od skutočnej hodnoty X aritmetického priemeru výsledky merania. Na vyriešenie problému môžete použiť aj tabuľku. 1.1, pričom namiesto hodnoty σ sa použije hodnota σ , teda y / (n 0,5) alebo s prihliadnutím na (1,14), pre konečný počet rozmerov

Stredná kvadratická chyba aritmetického priemeru S n rovná strednej štvorcovej chybe jednotlivého výsledku vydelenej druhou odmocninou počtu meraní.

Toto je základný zákon zvyšovania presnosti so zvyšujúcim sa pozorovaním. Z neho vyplýva, že na zvýšenie presnosti meraní 2-krát je potrebné zvýšiť počet meraní 4-krát. Tento záver však platí len pre merania, pri ktorých je presnosť výsledku úplne určená náhodnou chybou.

Zvyčajne sa vykoná relatívne malý počet meraní pre n, z ktorých je určená hodnota Sn . Ak pri posudzovaní pravdepodobnosti spoľahlivosti predpokladáme, že hodnota S n sa zhoduje s y a použite tabuľku. 1.1, potom získame nadhodnotené hodnoty α. Zo skutočnosti, že σ je hranica S n ako n → ∞, z toho vyplýva, že S n je úmerná hodnote σ . Koeficient úmernosti závisí od počtu meraní a odráža stupeň priblíženia S n do σ . Na základe toho môže byť interval ΔX reprezentovaný ako

Hodnoty t αn, nazývané Studentov koeficient, boli vypočítané pre rôzne hodnoty n a α a sú uvedené v tabuľke. 1.2. Porovnanie údajov v ňom uvedených s údajmi v tabuľke. 1.1 je ľahké vidieť, že pre veľké n má hodnota t αn tendenciu k zodpovedajúcim hodnotám hodnoty ε. Je to prirodzené, keďže s rastúcim n S n má tendenciu k σ .

Pomocou Študentových koeficientov môžeme do formulára prepísať rovnosť (1,14).

Pomocou tohto pomeru a tabuľky. 1.2 je ľahké určiť intervaly spoľahlivosti a pravdepodobnosti spoľahlivosti pre akýkoľvek malý počet meraní. Po vykonaní meraní musia byť známe všetky veličiny zahrnuté v tomto výraze – niektoré je možné vopred špecifikovať, iné určiť.

Mierou presnosti výsledkov merania je relatívna chyba (chyba), zvyčajne vyjadrená v percentách (%):


Hodnota ϕ = 1/δ, prevrátená hodnota relatívnej chyby, sa nazýva presnosť merania.

Pomocou tabuľky Studentových koeficientov môžete vyriešiť aj inverzný problém: pomocou známej absolútnej chyby meracieho zariadenia a danej hodnoty spoľahlivosti určte potrebný počet meraní v sérii.

APLIKÁCIA TEÓRIE PRAVDEPODOBNOSTI NA ŠTATISTIKU.

1. Základné pojmy.

2. Určenie neznámej distribučnej funkcie.

3. Stanovenie neznámych distribučných parametrov.

4. Interval spoľahlivosti. Pravdepodobnosť spoľahlivosti.

5. Aplikácia Studentovho testu na porovnanie všeobecných

agregátov.

6. Prvky korelačnej teórie.

7. Testovanie hypotézy o normálnom rozdelení všeobecného

totality. Pearsonov test dobrej zhody.

Základné pojmy.

Matematická štatistika je oblasť matematiky, ktorá študuje metódy spracovania a analýzy experimentálnych údajov získaných ako výsledok pozorovania masívnych náhodných udalostí a javov.

Pozorovania na objektoch sa môžu týkať všetkých členov skúmanej populácie bez výnimky a môžu sa obmedziť len na prieskumy len určitej časti členov tejto populácie. Prvé pozorovanie sa nazýva kontinuálne alebo úplné, druhé čiastočné resp selektívne .

Prirodzene, najúplnejšie informácie poskytuje nepretržité pozorovanie, ale nie vždy sa k nemu uchýli. Po prvé, nepretržité pozorovanie je veľmi náročné na prácu a po druhé je často prakticky nemožné alebo dokonca nepraktické. Preto sa v drvivej väčšine prípadov uchyľujú k selektívnemu výskumu.

Populácia, z ktorej sú niektorí jej členovia nejakým spôsobom vybraní na spoločné štúdium, sa nazýva všeobecná populácia , a časť všeobecnej populácie vybraná tak či onak je vzorovou populáciou resp vzorka .

Objem populácie je teoreticky neobmedzený, ale v praxi je vždy obmedzený.

Veľkosť vzorky môže byť veľká alebo malá, ale nemôže byť menšia ako dve.

Výber do vzorky sa môže uskutočniť náhodne (žrebovaním alebo žrebovaním). Alebo plánované, v závislosti od úlohy a organizácie prieskumu. Aby bola vzorka reprezentatívna, je potrebné dbať na rozsah variácie charakteristiky a skoordinovať s ňou veľkosť vzorky.

2. Určenie neznámej distribučnej funkcie.

Tak sme urobili výber. Rozdeľme rozsah pozorovaných hodnôt na intervaly , , …. rovnakú dĺžku. Na odhad požadovaného počtu intervalov môžete použiť nasledujúce vzorce:

Ďalej let m i - počet zahrnutých pozorovaných hodnôt i th interval. Delením m i na celkový počet pozorovaní n, dostaneme zodpovedajúcu frekvenciu i-och interval: , a . Vytvorme si nasledujúcu tabuľku:

Číslo intervalu Interval m i
m 1
m 2
... ... ... ...
k m k

ktorá sa volá štatisticky blízko . Empirický (alebo štatistické ) distribučná funkcia náhodná premenná je frekvencia udalosti taká, že množstvo ako výsledok experimentu nadobudne hodnotu menšiu ako X:

V praxi stačí nájsť hodnoty funkcie štatistického rozdelenia F*(x) v bodoch , čo sú hranice intervalov štatistických radov:

(5.2)

Treba poznamenať, že o a o . Zakreslením bodov a ich spojením hladkou krivkou získame približný graf empirickej distribučnej funkcie (obr. 5.1). Pomocou Bernoulliho zákona veľkých čísel môžeme dokázať, že pri dostatočne veľkom počte testov s pravdepodobnosťou blízkou jednotke sa empirická distribučná funkcia líši tak málo, ako si želáme, od distribučnej funkcie nám neznámej náhodnej premennej.

Často sa namiesto vykresľovania empirickej distribučnej funkcie robí nasledovné. Intervaly sú vynesené na osi x, ,…. . V každom intervale sa vytvorí obdĺžnik, ktorého plocha sa rovná frekvencii zodpovedajúcej tomuto intervalu. Výška Ahoj tohto obdĺžnika sa rovná , kde je dĺžka každého z intervalov. Je jasné, že súčet plôch všetkých zostrojených obdĺžnikov sa rovná jednej.

Uvažujme funkciu, ktorá je v intervale konštantná a rovná sa . Graf tejto funkcie sa nazýva histogram . Ide o stupňovitú čiaru (obr. 5.2). Použitím Bernoulliho zákona veľkých čísel je možné dokázať, že pre malé a veľké čísla sa s praktickou istotou len tak málo líši od hustoty distribúcie spojitej náhodnej premennej.

V praxi sa teda určuje typ neznámej distribučnej funkcie náhodnej premennej.

3. Stanovenie neznámych distribučných parametrov.

Získali sme teda histogram, ktorý dáva jasnosť. Jasnosť prezentovaných výsledkov nám umožňuje robiť rôzne závery a úsudky o skúmanom objekte.

Zvyčajne sa tam však nezastavia, ale idú ďalej a analyzujú údaje, aby otestovali určité predpoklady týkajúce sa možných mechanizmov skúmaných procesov alebo javov.

Hoci sú údaje v každom prieskume relatívne malé, chceli by sme, aby výsledky analýzy dostatočne popisovali celý skutočný alebo mysliteľný súbor (t. j. populáciu).

Na tento účel sa vytvárajú určité predpoklady o tom, ako ukazovatele vypočítané na základe experimentálnych údajov (vzorka) súvisia s parametrami všeobecnej populácie.

Riešenie tohto problému je hlavnou súčasťou akejkoľvek analýzy experimentálnych údajov a úzko súvisí s použitím množstva teoretických rozdelení diskutovaných vyššie.

Široké používanie normálneho rozdelenia v štatistických záveroch má empirické aj teoretické opodstatnenie.

Po prvé, prax ukazuje, že v mnohých prípadoch je normálne rozdelenie skutočne pomerne presnou reprezentáciou experimentálnych údajov.

Po druhé, teoreticky sa ukázalo, že priemerné hodnoty intervalov histogramov sú rozdelené podľa zákona blízkeho normálu.

Malo by sa však jasne chápať, že normálne rozdelenie je len čisto matematický nástroj a nie je vôbec potrebné, aby boli reálne experimentálne údaje presne opísané normálnym rozdelením. Aj keď v mnohých prípadoch s prihliadnutím na malú chybu môžeme povedať, že dáta sú normálne distribuované.

Vzorku charakterizuje množstvo ukazovateľov, ako je priemer, rozptyl atď., ktoré sa nazývajú štatistika. Rovnaké ukazovatele, ale vzťahujúce sa na populáciu ako celok, sa nazývajú parametre. Môžeme teda povedať, že štatistika slúži na odhad parametrov.

Všeobecný priemer je aritmetický priemer hodnôt všeobecný objem populácie:

Priemer vzorky je aritmetický priemer objemu vzorky:

(5.4)

ak je výber vo forme tabuľky.

Priemer vzorky sa berie ako odhad všeobecného priemeru.

Všeobecný rozptyl je aritmetický priemer druhej mocniny odchýlok hodnôt populácie z ich priemernej hodnoty:

Všeobecná štandardná odchýlka je druhá odmocnina zo všeobecného rozptylu: .

Rozptyl vzorky je aritmetický priemer štvorcov odchýlky hodnôt vzorky od ich priemeru:

Vzorová smerodajná odchýlka je definovaná ako .

Aby sa lepšie zhodovali s experimentálnymi výsledkami, zavádza sa koncept empirického (alebo korigovaného) rozptylu:

Na odhad všeobecnej štandardnej odchýlky použite opravenú štandardnú odchýlku alebo empirický štandard:

(5.5)

V prípade, keď sú všetky hodnoty vzorky odlišné, t.j. , , vzorce pre a majú tvar:

(5.6)

Interval spoľahlivosti. Pravdepodobnosť spoľahlivosti.

Rôzne štatistiky získané ako výsledok výpočtov sú bodovými odhadmi zodpovedajúcich parametrov populácie.

Ak extrahujeme určitý počet vzoriek zo všeobecnej populácie a nájdeme štatistické údaje, ktoré nás zaujímajú pre každú z nich, potom vypočítané hodnoty budú predstavovať náhodné premenné, ktoré majú určitý rozptyl okolo odhadovaného parametra.

Ale spravidla má výskumník ako výsledok experimentu k dispozícii jednu vzorku. Preto je veľmi zaujímavé získať intervalový odhad, t.j. určitý interval, v rámci ktorého, ako možno predpokladať, leží skutočná hodnota parametra.

Pravdepodobnosti uznané ako dostatočné na spoľahlivé úsudky o parametroch populácie na základe štatistík sa nazývajú spoľahlivosť.

Zvážte napríklad, ako odhadnúť parameter .

Interval

Uvažované bodové odhady parametrov rozdelenia poskytujú odhad vo forme čísla najbližšie k hodnote neznámeho parametra. Takéto odhady sa používajú len pre veľký počet meraní. Čím menšia je veľkosť vzorky, tým ľahšie je urobiť chybu pri výbere parametra. Pre prax je dôležité nielen získanie bodového odhadu, ale aj určenie intervalu, tzv dôverčivý, medzi hranicami ktorých s daným vierohodná pravdepodobnosť

kde q je hladina významnosti; x n, x b - dolná a horná hranica intervalu, nájde sa skutočná hodnota odhadovaného parametra.

Vo všeobecnosti možno intervaly spoľahlivosti zostaviť na základe Čebyševove nerovnosti. Pre každý distribučný zákon náhodnej premennej s momentmi prvých dvoch rádov je horná hranica pravdepodobnosti odchýlky náhodnej premennej x od distribučného centra X c spadajúca do intervalu tS x opísaná Čebyševovou nerovnicou.

kde S x je odhad štandardnej odchýlky rozdelenia; t je kladné číslo.

Na nájdenie intervalu spoľahlivosti nepotrebujete poznať zákon rozdelenia výsledkov pozorovania, ale potrebujete poznať odhad smerodajnej odchýlky. Intervaly získané pomocou Čebyševovej nerovnosti sa ukázali byť príliš široké na prax. Pravdepodobnosť spoľahlivosti 0,9 pre mnoho distribučných zákonov teda zodpovedá intervalu spoľahlivosti 1,6S X . Čebyševova nerovnosť dáva v tomto prípade 3,16S X. Z tohto dôvodu sa nerozšíril.

Používajú sa najmä v metrologickej praxi kvantilové odhady interval spoľahlivosti. Pod 100P percentuálny kvantil x p sa chápe ako úsečka takej zvislej čiary, naľavo od ktorej sa plocha pod krivkou hustoty rozdelenia rovná P %. Inými slovami, kvantil- ide o hodnotu náhodnej premennej (chyby) s danou pravdepodobnosťou spoľahlivosti P. Napríklad medián rozdelenia je 50 % kvantil x 0,5.

V praxi sa zvyčajne nazývajú 25% a 75% kvantily záhyby, alebo kvantily distribúcie. Medzi nimi leží 50 % všetkých možných hodnôt náhodnej premennej a zvyšných 50 % leží mimo nich. Interval hodnôt náhodnej premennej x medzi x 0 05 a x 0 95 pokrýva 90 % všetkých jej možných hodnôt a je tzv. interkvantilový interval s 90% pravdepodobnosťou. Jeho dĺžka je d 0,9 = x 0,95 - x 0,05.

Na základe tohto prístupu je predstavený koncept kvantilové chybové hodnoty, tie. chybové hodnoty s danou pravdepodobnosťou spoľahlivosti P - hranice intervalu neistoty ± D D = ± (x p - x 1-p)/2 = ± d p /2. Po jej dĺžke sa vyskytuje P% hodnôt náhodnej premennej (chyby) a q = (1- P)% z ich celkového počtu zostáva mimo tohto intervalu.

Na získanie intervalového odhadu normálne rozloženej náhodnej premennej je potrebné:

Určte bodový odhad MO x̅ a smerodajnú odchýlku Sx náhodnej premennej pomocou vzorcov (6.8) a (6.11), v tomto poradí;

Nájdite hornú hranicu x v a dolnú hranicu x n podľa rovníc

získané pri zohľadnení (6.1). Hodnoty x n a x b sú určené z tabuliek hodnôt integrálnej distribučnej funkcie F(t) alebo Laplaceovej funkcie Ф(1).

Výsledný interval spoľahlivosti spĺňa podmienku

kde n je počet nameraných hodnôt; z p je argument Laplaceovej funkcie Ф(1), zodpovedajúci pravdepodobnosti Р/2. V tomto prípade sa z p nazýva kvantilový faktor. Polovičná dĺžka intervalu spoľahlivosti sa nazýva medza spoľahlivosti chyby výsledku merania.

Príklad 6.1. Uskutočnilo sa 50 meraní konštantného odporu. Určte interval spoľahlivosti pre hodnotu MO konštantného odporu, ak je distribučný zákon normálny s parametrami m x = R = 590 Ohm, S x = 90 Ohm s pravdepodobnosťou spoľahlivosti P = 0,9.

Keďže hypotéza o normalite distribučného zákona nie je v rozpore s experimentálnymi údajmi, interval spoľahlivosti je určený vzorcom

Preto Ф(z р) = 0,45. Z tabuľky uvedenej v prílohe 1 zistíme, že z p = 1,65. Preto sa interval spoľahlivosti zapíše ako

Alebo 590 - 21< R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.

Ak sa zákon rozdelenia náhodnej premennej líši od normálneho, je potrebné zostrojiť jej matematický model a pomocou neho určiť interval spoľahlivosti.

Uvažovaná metóda zisťovania intervalov spoľahlivosti platí pre dostatočne veľký počet pozorovaní n, keď s = S x. Malo by sa pamätať na to, že vypočítaný odhad smerodajnej odchýlky S x je len aproximáciou skutočnej hodnoty s. Určenie intervalu spoľahlivosti pre danú pravdepodobnosť sa ukazuje ako menej spoľahlivé, čím menší je počet pozorovaní. Je nemožné použiť vzorce normálneho rozdelenia s malým počtom pozorovaní, ak nie je možné teoreticky určiť smerodajnú odchýlku na základe predbežných experimentov s dostatočne veľkým počtom pozorovaní.

Výpočet intervalov spoľahlivosti pre prípad, keď je rozdelenie výsledkov pozorovania normálne, ale ich rozptyl je neznámy, t.j. pri malom počte pozorovaní n je možné vykonať pomocou Studentovho rozdelenia S(t,k). Popisuje distribučnú hustotu pomeru (študentov zlomok):

kde Q je skutočná hodnota meranej veličiny. Množstvo x̅, S x. a S x ̅ sú vypočítané na základe experimentálnych údajov a predstavujú bodové odhady MO, štandardnú odchýlku výsledkov merania a štandardnú odchýlku aritmetického priemeru.

Pravdepodobnosť, že Študentov zlomok v dôsledku vykonaných pozorovaní nadobudne určitú hodnotu v intervale (- t p ; + t p)

kde k je počet stupňov voľnosti rovný (n - 1). Hodnoty t p (v tomto prípade nazývané študentské koeficienty), vypočítané pomocou posledných dvoch vzorcov pre rôzne hodnoty pravdepodobnosti spoľahlivosti a počet meraní, sú uvedené v tabuľke (pozri tabuľku v prílohe 1). Preto pomocou študentského rozdelenia môžete nájsť pravdepodobnosť, že odchýlka aritmetického priemeru od skutočnej hodnoty nameranej hodnoty nepresiahne

V prípadoch, keď rozdelenie náhodných chýb nie je normálne, sa často používa Studentovo rozdelenie s aproximáciou, ktorej stupeň zostáva neznámy. Študentovo rozdelenie sa používa pre množstvo meraní n< 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Р d, kde Р d je špecifická hodnota pravdepodobnosti spoľahlivosti. Faktor t pre veľký počet meraní n sa rovná kvantilovému faktoru z p. Pre malé n sa rovná Studentovmu koeficientu.

Výsledný výsledok merania nie je jedno konkrétne číslo, ale predstavuje interval, v ktorom sa s určitou pravdepodobnosťou P d nachádza skutočná hodnota nameranej hodnoty. Zvýraznenie stredu intervalu x vôbec neznamená, že skutočná hodnota je k nemu bližšie ako k ostatným bodom intervalu. Môže byť kdekoľvek v intervale as pravdepodobnosťou 1 - Р d aj mimo neho.

Príklad 6.2. Stanovenie špecifických magnetických strát pre rôzne vzorky jednej šarže elektrotechnickej ocele triedy 2212 poskytlo tieto výsledky: 1,21; 1,17; 1,18; 1,13; 1,19; 1,14; 1,20 a 1,18 W/kg. Za predpokladu, že neexistuje žiadna systematická chyba a náhodná chyba je rozdelená podľa normálneho zákona, je potrebné určiť interval spoľahlivosti pri hodnotách pravdepodobnosti spoľahlivosti 0,9 a 0,95. Na vyriešenie problému použite Laplaceov vzorec a študentské rozdelenie.

Pomocou vzorcov (6.8) v (6.11) nájdeme odhady aritmetického priemeru a štandardnej odchýlky výsledkov merania. V uvedenom poradí sa rovnajú 1,18 a 0,0278 W/kg. Za predpokladu, že odhad MSD sa rovná samotnej odchýlke, zistíme:

Odtiaľ to určíme pomocou hodnôt Laplaceovej funkcie uvedených v tabuľke v prílohe 1 z p= 1,65. Pre P = 0,95 je z koeficient p = 1,96. Intervaly spoľahlivosti zodpovedajúce P = 0,9 a 0,95 sú 1,18 ± 0,016 a 1,18 ± 0,019 W/kg.

Podľa tabuľky v prílohe 1 zistíme, že t 0,9 = 1,9 a t 0,95 = 2,37. Intervaly spoľahlivosti sú teda 1,18±0,019 a 1,18±0,023 W/kg.

Interval spoľahlivosti k nám prichádza z oblasti štatistiky. Ide o určitý rozsah, ktorý slúži na odhad neznámeho parametra s vysokou mierou spoľahlivosti. Najjednoduchšie sa to dá vysvetliť na príklade.

Predpokladajme, že potrebujete študovať nejakú náhodnú premennú, napríklad rýchlosť odozvy servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétneho webu, server odpovie rôznymi rýchlosťami. Skúmaný čas odozvy je teda náhodný. Interval spoľahlivosti nám teda umožňuje určiť hranice tohto parametra a potom môžeme povedať, že s 95% pravdepodobnosťou bude server v rozsahu, ktorý sme vypočítali.

Alebo potrebujete zistiť, koľko ľudí vie o ochrannej známke spoločnosti. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí si to uvedomujú, pohybuje v rozmedzí od 27 % do 34 %.

S týmto pojmom úzko súvisí hodnota pravdepodobnosti spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Od tejto hodnoty závisí, aký veľký bude náš požadovaný rozsah. Čím je hodnota väčšia, tým je interval spoľahlivosti užší a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

Tento ukazovateľ je tiež ovplyvnený rozptylom pozorovaní a jeho definícia je založená na predpoklade, že skúmaná charakteristika sa riadi týmto tvrdením, nazývaným aj Gaussov zákon. Normál je podľa neho rozdelenie všetkých pravdepodobností spojitej náhodnej veličiny, ktoré možno opísať hustotou pravdepodobnosti. Ak je predpoklad normálneho rozdelenia nesprávny, odhad môže byť nesprávny.

Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Existujú dva možné prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parameter z Laplaceovej distribučnej tabuľky,

σ je druhá odmocnina z rozptylu.

Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Používa sa na to nasledujúci vzorec:

σ2 = х2ср - (хср)2, kde

х2ср - priemerná hodnota druhých mocnín študovanej charakteristiky,

(хср)2 je druhá mocnina tejto charakteristiky.

Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - vzorový priemer,

α - znak,

t je parameter, ktorý sa nachádza pomocou študentskej distribučnej tabuľky t = t(ɣ;n-1),

sqrt(n) - druhá odmocnina z celkovej veľkosti vzorky,

s je druhá odmocnina z rozptylu.

Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bola študovaná charakteristika určená rovná 30 a výberový rozptyl rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu hodnotu meraného parametra.

Najprv určme, čomu sa t rovná: t = t (0,99; 7-1) = 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval spoľahlivosti pre rozptyl sa počíta tak v prípade známeho priemeru, ako aj vtedy, keď neexistujú údaje o matematickom očakávaní a je známa len hodnota bodového neskresleného odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby sa dajú vždy nájsť na internete.

Všimnime si len, že je vhodné určiť interval spoľahlivosti pomocou Excelu alebo sieťovej služby, ktorá sa tak nazýva.