Differenza tra popolazione e deviazione standard campione

Anonim

Popolazione vs Deviation standard campione

Nelle statistiche, sono utilizzati diversi indici per descrivere un set di dati corrispondente la sua tendenza centrale, la dispersione e l'inclinazione. La deviazione standard è una delle misure più comuni di dispersione dei dati dal centro del set di dati.

A causa di difficoltà pratiche, non sarà possibile utilizzare i dati di tutta la popolazione quando viene esaminata un'ipotesi. Pertanto, utilizziamo i valori dei dati da campioni per fare inferenze sulla popolazione. In una simile situazione, questi sono chiamati stimatori poiché stimano i valori dei parametri della popolazione.

È estremamente importante utilizzare stimatori imparziali in inferenza. Si dice che un stimatore sia imparziale se il valore atteso di tale stimatore è uguale al parametro della popolazione. Ad esempio, utilizziamo la media di esempio come un estimatore imparziale per la media della popolazione. (Matematicamente, si può dimostrare che il valore atteso della media del campione è uguale alla media della popolazione). Nel caso di stima della deviazione standard della popolazione, la deviazione standard del campione è anche un estimatore imparziale.

Qual è la deviazione standard della popolazione?

Quando i dati di tutta la popolazione possono essere presi in considerazione (ad esempio nel caso di un censimento) è possibile calcolare la deviazione standard della popolazione. Per calcolare la deviazione standard della popolazione, innanzitutto vengono calcolate le deviazioni dei valori dei dati dalla media della popolazione. Il quadrato medio radicale (media quadratica) delle deviazioni è chiamato deviazione standard della popolazione.

In una classe di 10 studenti, i dati sugli studenti possono essere facilmente raccolti. Se viene esaminata un'ipotesi su questa popolazione di studenti, non c'è bisogno di utilizzare i valori di esempio. Ad esempio, i pesi dei 10 studenti (in chilogrammi) sono misurati a 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Quindi il peso medio delle dieci persone (in chilogrammi) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, pari a 71 (in chilogrammi). Questa è la media della popolazione.

Ora per calcolare la deviazione standard della popolazione, calcoliamo le deviazioni dalla media. Le rispettive deviazioni dalla media sono (70 - 71) = -1, (62 - 71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (77-71) = 6 e (79-71) = 8. La somma dei quadrati di deviazione è ((70-71) = -1, (63-71) = -8, 2 + 1 2 + 9 2 2 + (-9) 2 + 6 2 + 8 2 + 2 + (-8) 2 = 366. La deviazione standard della popolazione è √ (366/10) = 6. 05 (in chilogrammi). 71 è il peso medio esatto degli studenti della classe e 6.05 è la deviazione standard esatta del peso da 71. Qual è la deviazione standard del campione? Quando vengono utilizzati dati da un campione (di dimensione n) per stimare i parametri della popolazione, viene calcolata la deviazione standard del campione. In primo luogo, vengono calcolate le deviazioni dei valori dei dati dalla media del campione. Poiché la media del campione viene utilizzata al posto della media della popolazione (che è sconosciuta), la media quadratica non è appropriata. Allo scopo di compensare l'utilizzo della media del campione, la somma dei quadrati delle deviazioni è divisa per (n-1) anziché n. La deviazione standard del campione è la radice quadrata di questo. In simboli matematici, S = √ {Σ (x i -ẍ)

2

/ (n-1)}, dove S è la deviazione standard del campione, ẍ è la media del campione x i sono i punti dati. Ora supponiamo che, nell'esempio precedente, la popolazione è gli studenti di tutta la scuola. Poi, la classe sarà solo un campione. Se questo campione viene utilizzato nella stima, la deviazione standard del campione sarà √ (366/9) = 6. 38 (in chilogrammi) poiché 366 è stato diviso per 9 invece di 10 (dimensione del campione). Il fatto da osservare è che non è garantito il valore esatto della deviazione standard della popolazione. È solo una stima per esso. Qual è la differenza tra la deviazione standard della popolazione e la deviazione standard del campione? • La deviazione standard della popolazione è l'esatto valore del parametro utilizzato per misurare la dispersione dal centro, mentre la deviazione standard del campione è un estimatore imparziale. • La deviazione standard della popolazione viene calcolata quando tutti i dati relativi a ciascun individuo della popolazione sono conosciuti. Altrimenti, viene calcolata la deviazione standard del campione.

• La deviazione standard della popolazione è data da σ = √ {Σ (xi-μ)

2

/ n} dove μ è la media della popolazione e n è la dimensione della popolazione ma la deviazione standard del campione è data da S = √ {Σ (xi-ẍ)

2

/ (n-1)} dove ẍ è la media del campione e n è la dimensione del campione.