test statistici

Area riservata alla discussione dei problemi sperimentali e all'esecuzione di attività sperimentale di fisica
Rispondi
feldspato
Messaggi: 20
Iscritto il: 13 feb 2010, 15:20

test statistici

Messaggio da feldspato » 3 lug 2011, 17:46

Che cosa significa eseguire un test del chi quadro ( o un test t di Student ) con un livello di confidenza del 95% ( oppure del 50%...) ? Che cosa indica il livello di confidenza?
Quale è la differenza tra l' eseguire un test a due code o ad una coda ?

.mg
Messaggi: 42
Iscritto il: 7 mar 2010, 18:04

Re: test statistici

Messaggio da .mg » 5 lug 2011, 16:08

Un test di ipotesi serve per verificare che un'ipotesi sia corretta. I test di cui parli, però, sono di natura statistica, nessuno ti dirà con certezza «sì, questa ipotesi» oppure «no, questa ipotesi è sbagliata». Dopo aver formulato un ipotesi da sottoporre a verifica (la cosiddetta "ipotesi nulla", pessima traduzione letterale dell'inglese "null hypothesis"), l'unica cosa che puoi chiedere al tuo test è «questa ipotesi è corretta, entro un certo livello di confidenza?». In un certo senso fissi una probabilità che l'ipotesi sia corretta. In realtà quello che in genere viene fatto è fissare il "livello di significatività" del test, cioè la probabilità di commettere un errore di tipo I, vale a dire un falso negativo: il test ti ha detto che l'ipotesi era falsa ma in realtà era vera. Un tipico valore del livello di confidenza usato è del 5%, il 95% (cioè il complementare a 1 del livello di significatività: ) invece è il "livello di confidenza".

Finora sono rimasto abbastanza nel vago ma dovrei aver risposto alla prima domanda (sperando anche di essere stato sufficientemente chiaro). Non so quanto conosci già dei test di ipotesi, per andare avanti comunque dovrei spiegare brevemente come funziona un test di verifica di ipotesi. Come già detto, per prima cosa si formula l'ipotesi nulla (, da qui il nome "null hypothesis") e un'ipotesi alternativa (). Si potrebbero forse fare più ipotesi alternative, ma rimaniamo sul semplice. Dopo di ciò si stabilisce il livello di significatività (oppure quello di confidenza, fissato uno hai anche l'altro ovviamente). Per eseguire il test devi tradurre in linguaggio matematico la tua ipotesi, quindi associ, secondo un preciso criterio, all'ipotesi un valore e con i dati a tua disposizione ti crei una variabile casuale, che assumerà un certo valore . Inoltre stabilisci la funzione di probabilità da utilizzare per effettuare il test (). Una volta fissati il livello di confidenza e la funzione di probabilità (e il numero di code da usare nel test, questo lo vedremo più avanti), automaticamente hai definito un "regione di accettazione", che è una regione del dominio della funzione di probabilità: se appartiene a questa regione allora secondo il tuo test è valida l'ipotesi , altrimenti il test ti suggerisce di rigettare l'ipotesi e prendere per buona l'ipotesi alternativa . La regione complementare a quella di accettazione si chiama "regione di rigetto" (o "rifiuto" o altri sinonimi a tua scelta). Il livello di confidenza non è altro che l'area compresa fra l'asse delle ascisse e la funzione di probabilità nella regione di accettazione. Ricorda che una funzione di distribuzione è non negativa e normalizzata a 1, quindi il livello di confidenza coincide con l'integrale definito. Invece sarà l'integrale della funzione estesa alla regione di rigetto. Ti chiederai perché si usa in genere il valore del 95%. Aumentando aumenta la probabilità di commettere un errore di tipo I, diminuendo il livello di confidenza aumenta invece la probabilità di commettere un errore di tipo II, o "falso positivo" (che è generalmente considerato meno grave di un errore di tipo I), cioè accettare l'ipotesi nulla quando in realtà è falsa. Il 95% è dunque un compromesso.

Passiamo alle code. Una possibile ipotesi nulla è che un certo parametro sia esattamente uguale al valore

Le possibili ipotesi alternative che puoi formulare sono
1)
2)
3)
Nei primi due casi si dice che il test è a una coda, nell'ultimo a due code, perché nei primi due casi la regione di rigetto è un solo intervallo (una coda) che va (generalmente, ma dipende dalla distribuzione usata) all'infinito, nel primo e nel secondo. Nell'ultimo caso la regione di rigetto è l'unione di due intervalli (due code) che vanno verso i due infiniti.

Dopo tutta questa pappardella teorica faccio un semplice esempio concreto nella speranza di chiarire i dubbi (non scenderò però troppo nei dettagli). Hai un campione di dati con media e deviazione standard della media . Ti chiedi se la media del campione possa essere . Evidentemente usando la sola incertezza di misura senza criterio uno direbbe che questa ipotesi è falsa e la rigetterebbe immediatamente. Tu invece vuoi eseguire un test più "raffinato" per controllare se questa ipotesi è plausibile. Per esempio decidi di usare la distribuzione normale ed effettuare un test a due code con un livello di confidenza . Formuli le ipotesi

e definisci la variabile casuale con distribuzione normale

All'ipotesi nulla dunque associ il valore 0, mentre dal tuo campione di dati ottieni

A questo punto vai a vedere nelle apposite tabelle delle distribuzioni e scopri che a un test di ipotesi a due code con distribuzione normale, livello di confidenza del 95% corrisponde un livello critico , cioè l'ipotesi può essere accettata se . Poiché nel tuo caso l'ipotesi può essere accettata, al contrario di quanto avrebbe fatto l'ingenuo (in senso buono :D) citato prima.

Rispondi