Differenza tra deviazione standard e errore standard Differenza tra

Anonim

Introduzione

Standard D eviazione (SD) e S standard > E rror (SE) sono terminologie apparentemente simili; tuttavia, sono concettualmente così diversi da essere usati quasi in modo intercambiabile nella letteratura statistica. Entrambi i termini sono solitamente preceduti da un simbolo più-meno (+/-) che è indicativo del fatto che definiscono un valore simmetrico o rappresentano un intervallo di valori. Invariabilmente, entrambi i termini appaiono con una media (media) di un insieme di valori misurati.

È interessante notare che una SE non ha nulla a che fare con gli standard, con errori o con la comunicazione di dati scientifici.

Uno sguardo dettagliato sull'origine e la spiegazione di SD e SE rivelerà, perché gli statistici professionisti e coloro che lo usano in modo sistematico tendono a sbagliare.

Deviazione standard (SD)

Una SD è una statistica

descrittiva che descrive la diffusione di una distribuzione. Come metrica, è utile quando i dati sono normalmente distribuiti. Tuttavia, è meno utile quando i dati sono molto distorti o bimodali perché non descrive molto bene la forma della distribuzione. In genere, utilizziamo la SD quando si riportano le caratteristiche del campione, perché intendiamo descrivere quanto i dati variano attorno alla media. Altre statistiche utili per descrivere la diffusione dei dati sono l'intervallo interquartile, il 25 ° e il 75 ° percentile e l'intervallo dei dati.

Figura 1. La SD è una misura della diffusione dei dati. Quando i dati sono un campione di una distribuzione distribuita normalmente, allora ci si aspetta che due terzi dei dati si trovino entro 1 deviazione standard della media.

La varianza è anche una statistica

descrittiva ed è definita come il quadrato della deviazione standard. Di solito non viene riportato quando si descrivono i risultati, ma si tratta di una formula più trattabile matematicamente (ad esempio k la somma delle deviazioni al quadrato) e svolge un ruolo nel calcolo delle statistiche.

Ad esempio, se abbiamo due statistiche

P e Q con varianze note var (P) e < var (Q) , quindi la varianza della somma P + Q è uguale alla somma delle varianze: var (P) + > var (Q) . Ora è evidente il motivo per cui agli statistici piace parlare di varianze. Ma le deviazioni standard hanno un significato importante per la diffusione, in particolare quando i dati sono distribuiti normalmente: la media dell'intervallo +/- 1 SD può catturare 2/3 del campione e l'intervallo significa che

+ - 2 SD può catturare il 95% del campione. SD fornisce un'indicazione di quanto le risposte individuali a una domanda variano o "deviano" dalla media.SD dice al ricercatore come sono distribuite le risposte - sono concentrate intorno alla media, o sparse in lungo e in largo? Tutti i tuoi intervistati hanno valutato il tuo prodotto nel mezzo della tua scala, o alcuni lo hanno approvato e alcuni lo hanno disapprovato? Considera un esperimento in cui agli intervistati viene chiesto di valutare un prodotto su una serie di attributi su una scala a 5 punti. La media per un gruppo di dieci intervistati (etichettati da "A" a "J" sotto) per "un buon rapporto qualità / prezzo" era 3. 2 con un SD di 0. 4 e la media per "affidabilità del prodotto" era 3. 4 con una SD di 2. 1. A prima vista (guardando solo i mezzi) sembrerebbe che l'affidabilità sia stata valutata superiore al valore. Ma la maggiore SD per affidabilità potrebbe indicare (come mostrato nella distribuzione di seguito) che le risposte erano molto polarizzate, dove la maggior parte degli intervistati non aveva problemi di affidabilità (valutato l'attributo a "5"), ma un segmento più piccolo, ma importante di un problema di affidabilità e valutato l'attributo "1". Guardando solo il significato del significato di una parte della storia, tuttavia, il più delle volte, questo è ciò su cui i ricercatori si concentrano. La distribuzione delle risposte è importante da considerare e la SD fornisce una preziosa misura descrittiva di ciò.

Rispondente

Buon valore per il denaro

Affidabilità prodotto

A 3 1
B 3 1
C 3 < 1 D
3 1 E
4 5 F
4 5 G
3 5 H
3 5 I
3 5 J
3 5 medio
3. 2 3. 4 Std. Dev.
0. 4 2. 1 Primo censimento: i rispondenti valutano un prodotto su una scala a 5 punti
Due distribuzioni molto diverse di risposte a una scala di valutazione a 5 punti possono produrre la stessa media. Considera il seguente esempio che mostra i valori di risposta per due valutazioni diverse. Nel primo esempio (Classificazione "A"), SD è zero perché TUTTE le risposte erano esattamente il valore medio. Le risposte individuali non hanno affatto deviato dalla media. Nel Rating "B", anche se la media del gruppo è la stessa (3. 0) della prima distribuzione, la Deviazione Standard è più alta. La deviazione standard di 1. 15 mostra che le risposte individuali, in media *, erano a poco più di 1 punto dalla media.

Rispondente

Classificazione "A"

Classificazione "B"

A

3 1 B
3 2 C
3 2 D
3 3 E
3 3 F
3 3 G
3 > 3 H 3
4 I 3
4 J 3
5 medio 3. 0
3. 0 Std. Dev. 0. 00
1. 15 Secondo censimento: i rispondenti valutano un prodotto su una scala a 5 punti Un altro modo di guardare la SD è tracciare la distribuzione come un istogramma di risposte. Una distribuzione con un SD basso si visualizzerebbe come una forma stretta e alta, mentre una SD più grande sarebbe indicata da una forma più ampia.
SD generalmente non indica "giusto o sbagliato" o "migliore o peggiore" - un SD inferiore non è necessariamente più desiderabile. È usato puramente come statistica descrittiva. Descrive la distribuzione in relazione alla media. T disclaimer ecologico relativo a SD

Pensare a SD come a una "deviazione media" è un modo eccellente di comprendere concettualmente il suo significato. Tuttavia, in realtà non è calcolato come media (se lo fosse, lo chiameremmo "deviazione media"). Invece, è "standardizzato", un metodo un po 'complesso di calcolare il valore usando la somma dei quadrati.

Ai fini pratici, il calcolo non è importante. La maggior parte dei programmi di tabulazione, fogli di calcolo o altri strumenti di gestione dei dati calcoleranno la SD per te. Più importante è capire cosa trasmettono le statistiche.

Errore standard

Un errore standard è una statistica inferenziale

che viene utilizzata quando si confrontano medie campionarie (medie) tra le popolazioni. È una misura di

precisione

della media campionaria. La media campionaria è una statistica derivata da dati che ha una distribuzione sottostante. Non possiamo visualizzarlo allo stesso modo dei dati, poiché abbiamo eseguito un singolo esperimento e abbiamo solo un singolo valore. La teoria statistica ci dice che la media campionaria (per un grande campione "sufficiente" e in alcune condizioni di regolarità) è approssimativamente distribuita normalmente. La deviazione standard di questa distribuzione normale è ciò che chiamiamo l'errore standard.

Figura 2. La distribuzione in basso repre rappresenta la distribuzione dei dati, mentre la distribuzione in alto è la distribuzione teorica della media campionaria. La SD di 20 è una misura della diffusione dei dati, mentre la SE di 5 è una misura di incertezza attorno alla media campionaria. Quando vogliamo confrontare i mezzi di risultati di un esperimento a due campioni del trattamento A e del trattamento B, allora dobbiamo stimare quanto precisamente abbiamo misurato i mezzi. In realtà, siamo interessati a quanto precisamente abbiamo misurato la differenza tra i due mezzi. Chiamiamo questa misura l'errore standard della differenza. Potresti non essere sorpreso di apprendere che l'errore standard della differenza nel mezzo campione è una funzione degli errori standard dei mezzi:

Ora che hai capito che l'errore standard della media (SE) e il la deviazione standard della distribuzione (SD) è di due animali diversi, ci si potrebbe chiedere come si siano confusi in primo luogo. Sebbene differiscano concettualmente, hanno una semplice relazione matematica: , dove n è il numero di punti dati. Si noti che l'errore standard dipende da due componenti: la deviazione standard del campione e la dimensione del campione

n

. Questo ha un senso intuitivo: più grande è la deviazione standard del campione, meno preciso possiamo essere sulla nostra stima della media reale.

Inoltre, maggiore è la dimensione del campione, più informazioni abbiamo sulla popolazione e più precisamente possiamo stimare la vera media.

SE è un'indicazione dell'affidabilità della media. Una piccola SE indica che la media campionaria è un riflesso più accurato della media effettiva della popolazione.Una dimensione del campione più grande normalmente produrrà un SE più piccolo (mentre la SD non è direttamente influenzata dalle dimensioni del campione).

La maggior parte delle ricerche sui sondaggi prevede il prelievo di un campione da una popolazione. Quindi facciamo inferenze sulla popolazione dai risultati ottenuti da quel campione. Se è stato disegnato un secondo campione, i risultati probabilmente non corrisponderanno esattamente al primo campione. Se il valore medio per un attributo rating era 3. 2 per un campione, potrebbe essere 3. 4 per un secondo campione della stessa dimensione. Se dovessimo disegnare un numero infinito di campioni (di uguale dimensione) dalla nostra popolazione, potremmo visualizzare i mezzi osservati come una distribuzione. Potremmo quindi calcolare una media di tutti i nostri mezzi di campionamento. Questa media equivarrebbe alla media della popolazione reale. Possiamo anche calcolare la SD della distribuzione di medie campionarie. La SD di questa distribuzione di medie campionarie è la SE di ogni singola media campionaria. Abbiamo, quindi, la nostra osservazione più significativa: SE è la SD della media della popolazione.

Esempio

medio

prima

3. 2 2 °

3. 4 3
3. 3 4 °
3. 2 5 °
3. 1 ….
…. ….
…. ….
…. ….
…. ….
…. medio
3. 3 Std. Dev.
0. 13 Tabella che illustra la relazione tra SD e SE
Ora è chiaro che se la SD di questa distribuzione ci aiuta a capire fino a che punto una media campionaria è dalla media della popolazione reale, allora possiamo usare questo per capire come accurata qualsiasi media campionaria individuale è in relazione alla media reale. Questa è l'essenza di SE.
In realtà, abbiamo estratto solo un singolo campione dalla nostra popolazione, ma possiamo usare questo risultato per fornire una stima dell'affidabilità della media campionaria osservata. In effetti, SE ci dice che possiamo essere sicuri al 95% che la nostra media campionaria osservata sia più o meno all'incirca 2 (in realtà 1. 96) Errori standard dalla media della popolazione.

La tabella seguente mostra la distribuzione delle risposte dal nostro primo (e unico) campione utilizzato per la nostra ricerca. La SE di 0. 13, essendo relativamente piccola, ci dà un'indicazione che la nostra media è relativamente vicina alla media reale della nostra popolazione complessiva. Il margine di errore (al 95% di confidenza) per la nostra media è (approssimativamente) il doppio di tale valore (+/- 0, 26), indicando che la media effettiva è molto probabilmente tra 2. 94 e 3. 46.

Resistente

Valutazione

A

3

B
3 C
3 D
3 E
4 F
4 G
3 H
3 I
3 J
3 medio > 3. 2
Std. Err 0. 13
Sommario
Molti ricercatori non riescono a capire la distinzione tra Deviazione standard e Errore standard, anche se sono comunemente inclusi nell'analisi dei dati. Mentre i calcoli effettivi per la deviazione standard e l'errore standard sembrano molto simili, rappresentano due misure molto diverse ma complementari. SD ci parla della forma della nostra distribuzione, quanto sono vicini i valori dei singoli dati dal valore medio. SE ci dice quanto la nostra media campionaria sia vicina alla media reale della popolazione complessiva.Insieme, aiutano a fornire un'immagine più completa di quella che il solo significato può dirci.