Indeksi disperzije u statistici

Vrijeme Čitanja ~4 Min.
Indeksi disperzije su važni jer opisuju varijabilnost pronađenu u određenoj populaciji ili uzorku. Evo kako ih koristiti.

U distribuciji podataka indeksi disperzije igraju vrlo važnu ulogu. Ova mjerenja nadopunjuju mjerenja takozvanog središnjeg položaja karakterizirajući varijabilnost podataka.

The indeksi disperzije nadopunjuju one središnje tendencije. Oni su također bitni u distribuciji podataka. To je zato što karakteriziraju njegovu varijabilnost. Njihovu važnost u statističkoj obuci istaknuli su Wild i Pfannkuch (1999).

Percepcija varijabilnosti podataka jedna je od osnovnih komponenti statističkog razmišljanja jer nam daje informacije o disperziji podataka u odnosu na prosjek.

Tumačenje prosjeka

The aritmetička sredina naširoko se koristi u praksi, ali se često može pogrešno protumačiti. To se događa kada su vrijednosti varijable vrlo rijetke. U tim slučajevima potrebno je priložiti prosječne indekse disperzije (2).

Indeksi disperzije imaju tri važne komponente povezane sa slučajnom varijabilnošću (2):

  • Percepcija njegove sveprisutnosti u svijetu oko nas.
  • Natječaj za njegovo obrazloženje.
  • Sposobnost njezinog kvantificiranja (što podrazumijeva razumijevanje i poznavanje primjene koncepta disperzije).

Za što se koriste indeksi disperzije?

Kada je potrebno generalizirati podatke uzorka populacije Indeksi disperzije vrlo su važni jer izravno utječu na pogrešku s kojom radimo . Što više raspršenosti prikupimo u uzorku, potrebna nam je veća veličina da bismo radili s istom pogreškom.

S druge strane ovi nam indeksi pomažu utvrditi jesu li naši podaci daleko od središnje vrijednosti. Oni nam govore je li ova središnja vrijednost primjerena za predstavljanje ispitivane populacije. Ovo je vrlo korisno za usporedbu distribucija i shvatiti rizici u procesu donošenja odluka (1).

Ti su omjeri vrlo korisni za usporedbu distribucija i razumijevanje rizika pri donošenju odluka. Što je veća disperzija, središnja vrijednost je manje reprezentativna .

Najčešće korišteni su:

Funkcije indeksa disperzije

Raspon

Korištenje ranga služi za primarnu usporedbu. Na ovaj način uzima u obzir samo dva ekstremna promatranja . Zbog toga se preporučuje samo za male uzorke (1). Definira se kao razlika između zadnje vrijednosti varijable i prve (3).

Statističko odstupanje

Srednje odstupanje pokazuje gdje bi podaci bili koncentrirani da su svi bili na istoj udaljenosti od aritmetičke sredine (1). Odstupanjem vrijednosti varijable smatramo razliku u apsolutnoj vrijednosti između vrijednosti te varijable i aritmetičke sredine niza. Stoga se smatra aritmetičkom sredinom odstupanja (3).

Varijanca

Varijanca je algebarska funkcija svih vrijednosti prikladno za inferencijalne statističke zadatke (1). Može se definirati kao kvadratno odstupanje (3).

Standardna ili tipična devijacija

Za uzorke iz iste populacije standardna devijacija jedna je od najčešće korištenih (1). To je kvadratni korijen varijance (3).

Koeficijent varijacije

To je mjera koja se prvenstveno koristi za usporedbu promjene između dva skupa podataka izmjerenih u različitim jedinicama I. Na primjer visinu i težinu korpus učenika u uzorku. Koristi se za određivanje u kojoj su distribuciji podaci najviše grupirani, a srednja vrijednost najreprezentativnija (1).

Koeficijent varijacije je reprezentativniji indeks disperzije od prethodnih jer je apstraktan broj. Drugim riječima neovisno je prema jedinicama u kojima se pojavljuju vrijednosti varijable. Općenito se ovaj koeficijent varijacije izražava kao postotak (3).

Zaključci o indeksima disperzije

Indeksi disperzije pokazuju s jedne strane stupanj varijabilnosti u uzorku. S druge strane, reprezentativnost središnje vrijednosti jer ako dobijete nisku vrijednost to znači da su vrijednosti koncentrirane oko tog središta. To bi značilo da postoji mala varijabilnost u podacima i da centar sve to dobro predstavlja.

Naprotiv, ako dobijete visoku vrijednost to znači da vrijednosti nisu koncentrirane već raspršene. To znači da postoji mnogo varijabilnosti i središte neće biti baš reprezentativno. S druge strane, pri donošenju zaključaka trebat će nam veći uzorak ako želimo smanjiti grešku povećana upravo zbog porasta varijabilnosti.

Popularni Postovi