2. Statistica inferenziale
• Consente di verificare ipotesi sperimentali a
partire dai dati ottenuti da un campione di
soggetti estratti casualmente dalla
popolazione
• A partire da effetti riscontrati nel campione è
possibile INFERIRE le caratteristiche “vere”
della popolazione.
3. Verifica di Ipotesi
Ipotesi Nulla (H0): I valori ottenuti dal campione
sono dovuti al caso quindi non sono diversi da
quelli della popolazione
Ipotesi Alternativa (H1): I valori ottenuti dal
campione non sono dovuti al caso ma attribuibili
ad una particolare teoria
Bidirezionale: Mi aspetto una differenza tra i dati
del campione e quelli della popolazione senza
saperne specificare la direzione
Monodirezionale: Sono in grado di formulare
ipotesi direzionali
4. Test statistico
“I test statistici si confrontano con la probabilità che le
differenze emerse dall’esperimento siano dovute al
caso. Se questa probabilità è davvero molto bassa
allora possiamo rigettare l’ipotesi nulla. Possiamo
quindi accettare l’ipotesi sperimentale che i risultati
dell’esperimento siano significativi cioè non casuali”
(Greene e D’Oliveira, 2000)
Test Z •Ipotesi con una sola variabile ( il confronto è con la popolazione
normativa)
Test T • Ipotesi con due variabili ( il confronto è con un altro gruppo)
Test F
Test “CHI quadrato”
5. Le tavole statistiche
• Applicata una statistica si ottiene un
punteggio. Per capire se questo punteggio ci
consente di accettare o rifiutare l’ipotesi nulla
dobbiamo fare riferimento alle TAVOLE
STATISTICHE che consentono di verificare
l’esatta percentuale di probabilità che i
risultati siano dovuti al caso. Se l’ipotesi è
bidirezionale è necessario dimezzare l’alfa, per
ottenere l’esatta significatività.
6. Test Z con una sola variabile
(confronto con la popolazione)
18. Test T con una sola variabile
(confronto con la popolazione)
Quando non conosciamo la distribuzione della
variabile e l’ampiezza campionaria è inferiore
a 30 unità non si può fare riferimento alla
distribuzione normale quindi bisogna riferirsi
alla distribuzione t di Student
All’aumentare di n la differenza tra t e Z è
trascurabile (teoria del limite centrale)
21. Test T- Tavola della
distribuzione-
Stabilire la soglia di Rifiuto di Ho, individuando il
valore di riferimento sulla tavola
La tavola del test T definisce il valore soglia, (T
critico) in funzione della probabilità richiesta,
specifica per il tipo di ipotesi (mono/bidirezionale)
e dei gradi di libertà
Gradi di libertà: Ci domandiamo se i punteggi della
popolazione e del campione variano allo stesso
modo oppure no. Per verificare le ipotesi è
necessario che i punteggi siano liberi di variare
GDL= N-1
59. Ancora un esempio
T test per campioni
appaiati/dipendenti/relazionato
• Esempio misuriamo i livelli di ansia di 7 soggetti
prima e dopo una seduta di rilassamento.
H0: Pre= Post
H1: Pre≠Post (bidirezionale)
H1: Pre>Post (monodirezionale)
α= 0.05
61. Chi Quadrato (χ2)
• Quando si hanno scale nominali o ordinali, non è
possibile calcolare il t e z, poiché non abbiamo
medie, ma solo frequenze.
• Il test chi quadrato fa dunque riferimento a
categorie e non a punteggi
(Es: verificare se le persone presentano o meno un certo comportamento)
• Ciò che si intende verificare è se la distribuzione di
frequenza dei soggetti nelle diverse categorie sia
dovuta al caso oppure no.
• I soggetti sono inclusi in una ed una sola categoria
62.
63. Applicazione χ2
• TEST UNIDIMENSIONALE: indagini con una
sola variabile- quando si confronta la
distribuzione di frequenze osservate con un
modello teorico di riferimento (frequenze
teoriche)-
• TEST BIDIMENSIONALE: indagine con due
variabili- quando si studia la relazione tra due
variabili-
64. Test ad una sola variabile
• Confronta le frequenze osservate (e.g. numero
di soggetti distribuiti per cella) con le
frequenze attese (numero di soggetti che
dovrebbero trovarsi in ogni cella in funzione di
assunti teorici)
• H0: F (OSSERVATA) = F (TEORICA)
• H1: F (OSSERVATA) ≠ F (TEORICA)
65. Test Unidimensionale
Esempio
Si vuole confrontare l’efficacia percepita delle tecniche di
rilassamento chiedendo ad un gruppo di 45 soggetti di
stabilire in quale momento della giornata reputino più
efficace il training tra MATTINA, POMERIGGIO, SERA
H0: Non ci sia differenza nei 3 momenti della
giornata. Se l’ipotesi nulla è vera dovrei attendermi che il numero di
soggetti in ogni categoria sia più o meno uguale, quindi che non si discosti
troppo dal caso 45/3 = 15. Questo valore lo chiamiamo “FREQUENZA
ATTESA o TEORICA”
H1 : C’è un momento in cui il rilassamento è
percepito come più efficace.
66. MATTINA POMERIGGIO SERA Tot Freq. Teoriche
Frequenze Osservate 10 12 23 45 45/3 = 15
Fo = frequenze osservate
F t = frequenze teoriche (attese)
Per ogni categoria si calcola il quadrato della differenza tra le frequenze osservate e
quelle attese e si divide per le frequenza attese. Il χ2 è dato dalla somma dei
risultati di questa operazione per ogni categoria.
La distribuzione del χ2 dipende dai gradi di libertà, che per un disegno con una sola
variabile sarà gdl= K-1 ; il numero di categorie disponibili – 1
Inoltre essendo la distribuzione del χ2 ad una sola coda (destra) i livelli di α
saranno sempre monodirezionali.
Le ipotesi invece sono sempre bidirezionali, ciò che il χ2 consente di stabilire è che
esiste una differenza tra frequenze osservate e frequenze attese.
68. Calcolo dei Residui
• Il fatto che il χ2 sia significativo ci dice solo che
le frequenze teoriche (attese) sono diverse da
quelle osservate. Per comprendere quale
categoria è diversa dalle altre, è opportuno
calcolare i RESIDUI STANDARDIZZATI per
ognuna delle celle
70. INTERPRETAZIONE R
Nel nostro caso:
Nelle celle MATTINA E POMERIGGIO non c’è differenza tra frequenze attese e
frequenze osservate
Nella cella SERA c’è differenza tra frequenze attese e frequenze osservate, in termini
di un numero maggiore di frequenze rispetto a quelle attese.
La conclusione che possiamo desumere è che gli effetti del rilassamento sono
percepiti come maggiormente benefici la sera ( da qui si possono porre nuove basi
per studi successivi )
71. Test χ2 con 2 Variabili
Si utilizza quando si è interessati a verificare la
relazione tra 2 variabili come ad esempio il
percorso scelto per Arrivare in P.zza Ferrarese e il
genere.
H0: se tra le due variabili non c’è relazione i
soggetti si distribuiranno in maniera casuale nelle
categorie, ovvero non c’è relazione tra il genere e
la scelta del percorso
Il calcolo del χ2 rimane invariato, ciò che varia è la
modalità di organizzare i dati:TABELLA A DOPPIA
ENTRATA o di CONTINGENZA, e il calcolo delle
FREQUENZE ATTESE
72. Esempio
• TABELLA DI CONTINGENZA
M F
MARGINALE DI RIGA
C.so Cavour 36 31 67
C.so Vitt.Eman 19 22 41
55 53 108
MARGINALE DI COLONNA
Totale dei marginali
73. Calcolo delle Frequenze attese
• Se la relazione tra le due variabili è casuale,
significa che ad esempio il numero di maschi
che percorre C. Cavour deve essere
proporzionale al numero totale di persone che
sceglie C.so Cavour nel campione complessivo.
Se vi sono 67 persone su 108 quante ce ne
saranno su 55?? M F
C.so Cavour ?? 67
x:55=67:108; C.so Vitt.Eman
x=(55*67) /108 = 34,1 55 108
74. Calcolo delle Frequenze
attese
M F
C.so Cavour 34,1 b 67
C.so Vitt.Eman c d 41
55 53 108
Freq. attesa (a) = 34.1
Freq. attesa (b)= (53*67)/108; = 32.8
Freq. attesa (c)= (55*41)/108=20.08
Freq.attesa (d)= (54*41)/ 108= 20.5
M F
C.so Cavour 34,1 32,08
C.so Vitt.Eman20,05 20,5
76. Esercitazione
• Verificare la relazione tra Soddisfazione dopo
un esame affrontato con successo e Locus of
Control (interno vs esterno)
77. Svolgere l’esercizio senza tener conto della correzione di Yates (VI colonna) che
consiste nel sottrarre 0,5 a ogni differenza assoluta tra la frequenza osservata e
quella attessa
L of Contr
Interno
Esterno
78. Analysis of Variance (ANOVA)
L’ ANALISI DELLA VARIANZA VIENE UTILIZZATA QUANDO SI
VOGLIONO CONFRONTARE LE MEDIE DI Più GRUPPI
Quando le medie sono solamente due è indifferente
usare questo test F (per ANOVA) o il t-test
ANALISI DELLA VARIANZA AD UNA VIA (One Way ANOVA)
ANALISI DELLA VARIANZA A PIU’ VIE
La scelta dipende dal numero di fattori presi in
considerazione; il fattore è la causa di variazione
considerata.
79. One Way ANOVA
QUANDO SI HA UNA SOLA VARIABILE DIPENDENTE E
UNA SOLA VARIABILE INDIPENDENTE (fattore)
Esempio
Verificare se l’età (3 gruppi) produce una riduzione
nella percezione delle capacità mnestiche.
Somministriamo ai 3 gruppi un test sulla percezione
dei fallimenti cognitivi.
Il nostro fattore è l’età a tre livelli (giovane,
adulto,anziani), la VD ovvero la variabile che
prendiamo in considerazione per osservare gli effetti
dell’età è la percezione delle proprie capacità
mnestiche
80. Indagine sulla Varianza – Il Test F-
• VARIANZA ENTRO I GRUPPI –Varianza within- (differenze
individuali proprie dei soggetti presi inconsiderazione o
varianza d’errore)
• VARIANZA TRA I GRUPPI –Varianza between-( dovuta al
fattore di interesse ETA)
-Test F-
Si tratta del rapporto tra due varianze Varianza B/Varianza W
VarB/ VarW segue la distribuzione F di Fisher che è tabulata in
funzione dei gradi di libertà
• Quando VarB è grande e VarW è piccola il test risulterà
significativo
81. Ipotesi
H0: tutte le medie sono uguali tra di loro
• H0: µ1 = µ2 = … = µK = µ
H1: almeno una media è diversa dalle altre
• H1: esiste almeno uno strato k per cui µk ≠ µ
Il test F è un test globale, per sapere quale sia la
media che differisce dalle altre bisogna
operare i post-hoc (ovvero facciamo dei test t
tra le coppie delle medie)
82. I gradi di Libertà
• Ogni componente di devianza ha un suo diverso
grado di libertà
• DEVIANZA TRA I GRUPPI (B): k-1 gdl (perde il gd l
dellamedia totale)
• DEVIANZA ENTRO I GRUPPI (W): n-k gdl(si perde
un gdl per ogni media di gruppo
In cui:
N = numero dei soggetti
k = numero delle condizioni/gruppi
85. Anova a più vie o Fattoriale
Si utilizza quando il disegno sperimentale prende in
considerazione più variabili indipendenti.
Uno dei Vantaggi della ANOVA fattoriale: Permette
di evidenziare le interazioni tra variabili , ovvero
gli effetti congiunti delle variabili indipendenti
sulla variabile dipendente.
86. Fonti di Varianza
Il modello bivariato ha lo scopo di individuare
quanta parte della varianza della v.d. sia
dovuta:
– agli effetti dei trattamenti del primo fattore
– agli effetti dei trattamenti del secondo fattore
– agli effetti d’interazione tra il primo ed il secondo fattore
– agli effetti dovuti alle differenze individuali.
87. Variabilità Totale
Variabilità tra i gruppi Variabilità entro i gruppi
Varianza Varianza Varianza
1° fatt. 2° fatt. 1° fatt x 2° fatt.
Il calcolo degli F avviene dividendo le varianze degli effetti principali e di quello
d’interazione per la varianza entro i gruppi
89. Gradi di libertà
Fattore 1
Gdl B= k1-1 Var B (fattore1)+ VarB (fattore2)+ VarB (interazione)
F=
Fattore 2 Varianza W
Gdl B= k2-1
Effetto interazione
GdlB= gdl1 * gdl2
Gdl W comune a tutti = (N-1)- gdl (1)-gdl(2)-gdl
(int) oppure N- (k1 *k2 )
90. Esempio
• Disegno fattoriale 3x2
36 soggetti vengono reclutati per valutare gli effetti
dell’età (giov, ad, anz) e della depressione (Media
dei punteggi alti e bassi) sulla percezione dei
fallimenti mnestici.
Effetto principale dell’età
GdlB= k-1, 3-1= 2
Effetto principale del livello di depressione
GdlB=K-1; 2-1 = 1
Effetto di interazione Eta X Depressione
GdlB = 2*1
91. Gdl W = (36-1)- 2 - 1- 2 = 30
Effetto principale Età
F critico= 3,32
Effetto principale del livello di depressione
F critico = 4,17
Effetto di interazione Eta X Depressione
F critico = 3,32