Outliersov vzorec (obsah)

  • Odľahlá vzorec
  • Príklady vzorcov odľahlých hodnôt (so šablónou programu Excel)

Odľahlá vzorec

V štatistike sú Outliers dva extrémne vzdialené neobvyklé body v daných súboroch údajov. Extrémne vysoká hodnota a extrémne nízke hodnoty sú odľahlé hodnoty súboru údajov. To je veľmi užitočné pri hľadaní akejkoľvek chyby alebo chyby, ku ktorej došlo. Ako už názov napovedá, odľahlé hodnoty sú hodnoty, ktoré ležali mimo zvyšku hodnôt v množine údajov. Napríklad, zvážte študentov inžinierstva a predstavte si, že vo svojej triede mali trpaslíkov. Takže trpaslíci sú ľudia, ktorých výška je v porovnaní s inými ľuďmi s normálnou výškou extrémne nízka. Toto je najvzdialenejšia hodnota v tejto triede. Vonkajšie hodnoty sa dajú vypočítať pomocou Tukeyovej metódy.

Vzorec pre odľahlé hodnoty -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Príklady vzorcov odľahlých hodnôt (so šablónou programu Excel)

Vezmime príklad, aby sme lepšie pochopili výpočet Outliersovho vzorca.

Túto šablónu Outliers si môžete stiahnuť tu - Outliers Template

Outliersov vzorec - príklad č. 1

Zvážte nasledujúci súbor údajov a vypočítajte odľahlé hodnoty pre súbor údajov.

Súbor údajov = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Vzostupné poradie množín údajov:

Medián množiny údajov o vzostupnom poradí sa vypočíta ako:

V tomto súbore údajov je celkový počet údajov 11. Takže n = 11. Medián = 11 + 1/2 = 12/2 = 6. Preto hodnota, ktorá je v tejto pozícii na šiestej pozícii, je mediánom.

Mediánová hodnota = 34.

Rozdeľte súbor údajov na dve polovice pomocou mediánu.

Medián súboru údajov o dolnej polovici a hornej polovici sa vypočíta ako:

  • Ak v dolnej polovici 2, 5, 6, 7, 23 nájdeme strednú hodnotu, ako sme našli v kroku 2, stredná hodnota by bola 6. Takže Q1 = 6.
  • Ak v hornej polovici 45, 56, 89, 98 309 nájdeme strednú hodnotu, ako sme našli v kroku 2, stredná hodnota by bola 89. Takže Q3 = 89.

IQR sa vypočítava pomocou vzorca uvedeného nižšie

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

Dolná odľahlá hodnota sa vypočíta pomocou vzorca uvedeného nižšie

Dolná odľahlá hodnota = Q1 - (1, 5 * IQR)

  • Dolná odľahlá hodnota = 6 - (1, 5 * 83)
  • Dolná odľahlá hodnota = -118, 5

Vyššia odľahlá hodnota sa vypočíta pomocou vzorca uvedeného nižšie

Vyššia odľahlá hodnota = Q3 + (1, 5 * IQR)

  • Vyššia odľahlá hodnota = 89 + (1, 5 * 83)
  • Vyššia odľahlá hodnota = 213, 5

Teraz získajte tieto hodnoty do súboru údajov -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Hodnoty, ktoré klesajú pod dolnú hodnotu strany a nad ňu vyššiu stranu. sú odľahlé hodnoty. Pre tento súbor údajov je 309 odľahlá hodnota.

Odľahlá vzorec - príklad č. 2

Zvážte nasledujúci súbor údajov a vypočítajte odľahlé hodnoty pre súbor údajov.

Súbor údajov = 45, 21, 34, 90, 109.

Vzostupné poradie množín údajov:

Medián množiny údajov o vzostupnom poradí sa vypočíta ako:

V tomto súbore údajov je celkový počet údajov 5. Takže n = 5. Medián = 5 + 1/2 = 6/2 = 3. Preto hodnota, ktorá je na 3. pozícii v tomto súbore údajov, je stredná hodnota.

Priemerná hodnota = 45.

Rozdeľte súbor údajov na dve polovice pomocou mediánu.

Medián súboru údajov o dolnej polovici a hornej polovici sa vypočíta ako:

  • Q1 = 27, 5
  • Q3 = 89

IQR sa vypočítava pomocou vzorca uvedeného nižšie

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Dolná odľahlá hodnota sa vypočíta pomocou vzorca uvedeného nižšie

Dolná odľahlá hodnota = Q1 - (1, 5 * IQR)

  • Dolná odľahlá hodnota = 27, 5 - (1, 5 * 72)
  • Dolná odľahlá hodnota = -80, 5

Vyššia odľahlá hodnota sa vypočíta pomocou vzorca uvedeného nižšie

Vyššia odľahlá hodnota = Q3 + (1, 5 * IQR)

  • Vyššia odľahlá hodnota = 99, 5 + (1, 5 * 72)
  • Vyššia odľahlá hodnota = 207, 5

vysvetlenie

Krok 1: Usporiadajte všetky hodnoty v danom súbore údajov vzostupne.

Krok 2: Nájdite strednú hodnotu pre údaje, ktoré sú zoradené. Medián možno nájsť pomocou nasledujúceho vzorca. Nasledujúci výpočet vám jednoducho poskytne pozíciu strednej hodnoty, ktorá sa nachádza v nastavenom dátume.

Medián = (n + 1) / 2

Kde n je celkový počet údajov dostupných v súbore údajov.

Krok 3: Nájdite spodnú hodnotu kvartilu Q1 zo súboru údajov. Ak to chcete nájsť, stredná hodnota rozdelí súbor údajov na dve polovice. Z dolnej polovice množiny hodnôt nájdite strednú hodnotu pre dolnú množinu, ktorá je hodnotou Q1.

Krok 4: Nájdite hornú hodnotu kvartilu Q3 zo súboru údajov. Je to presne ako v predchádzajúcom kroku. Namiesto spodnej polovice musíme postupovať rovnakým postupom ako horná polovica množín hodnôt.

Krok 5: Nájdite hodnotu IQR medzikvartilového rozsahu. Zistenie hodnoty odpočtu Q1 z Q3.

IQR = Q3-Q1

Krok 6: Nájdite hodnotu Inner Extreme. Koniec, ktorý spadá mimo spodnú stranu a ktorý sa dá nazvať aj menšou odľahlou hodnotou. Vynásobením hodnoty IQR 1, 5 a odpočítaním tejto hodnoty z Q1 získate extrémne dolné extrémy.

Dolná odľahlá hodnota = Q1 - (1, 5 * IQR)

Krok 7: Nájdite hodnotu Outer Extreme. Koniec, ktorý spadá mimo vyššiu stranu, ktorú možno nazvať aj hlavným odľahlým bodom. Vynásobením hodnoty IQR hodnotou 1, 5 a súčtom tejto hodnoty s Q3 získate Outer Higher extreme.

Vyššia odľahlá hodnota = Q3 + (1, 5 * IQR)

Krok 8: Hodnoty, ktoré sú mimo týchto vnútorných a vonkajších extrémov, sú najvyššími hodnotami pre daný súbor údajov.

Relevantnosť a použitie vzorcov odľahlých údajov

Mimoriadne hodnoty sú veľmi dôležité pri akomkoľvek probléme s analýzou údajov. Odľahlá hodnota ukazuje nekonzistenciu v akejkoľvek množine údajov, pretože je definovaná ako nezvyčajné vzdialené hodnoty v množine údajov z jednej na druhú. To je veľmi užitočné pri hľadaní akýchkoľvek chýb, ktoré sa vyskytli v súbore údajov. Pretože keď v súbore údajov zadáte chybu, ovplyvní to stredný priemer a stredný priemer teda môže mať veľké odchýlky vo výsledku, ak sú v súbore údajov odľahlé hodnoty. Preto je nevyhnutné zistiť údaje zo súboru údajov s cieľom vyhnúť sa vážnym problémom pri štatistickej analýze.

Odporúčané články

Toto bol sprievodca vzorcom Outliers. Tu diskutujeme o tom, ako vypočítať odľahlé hodnoty spolu s praktickými príkladmi a šablónou programu Excel na stiahnutie. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Sprievodca stredným vzorcom
  2. Príklady platového vzorca
  3. Kalkulačka pre vzorec DPMO
  4. Ako vypočítať T distribúciu?
  5. Kvartilná odchýlka vzorca Príklady

Kategórie: