La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos
1. Seminario 9 Estadística y TIC
TAREA SEMINARIO 9
Seminario 9 Blog: La Chi cuadrado de Pearson
El estadístico Chi cuadrado de Pearson
Condiciones de aplicabilidad
Conceptos útiles
Ejercicios con tablas
Ejercicio con SPSS
La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los
datos que observamos:
- Está dentro de lo normal y probable, es decir, la diferencia que observamos en
los datos es debida al azar.
- Recordemos que la Ho establece que no hay diferencia o lo que es lo mismo hay
igualdad.
- Aceptamos la Ho
- La diferencia que observamos es debida a algo más
- Rechazamos la hipótesis nula
La categoría de las variables que estudiamos tienen que ser excluyentes, cualitativa,
tamaño muestral mínimo de 50 casos, la frecuencia esperada en cada casilla no deben
ser inferior de 5 (aquí tendríamos q aplicar el Test de Fisher o Corrección de Yates;
También se puede reagrupar las variables.*)
Ejemplo clase: N=50
Ho: el consumo de tabaco no se relaciona con la enfermedad
E NE Total
F 4 21 25
NF 3 22 25
Total 7 43 50
* los valores de las variables (frecuencias) no deben ser menores de 5.
Comparar la frecuencia observada con la esperada
Grado de libertad: depende de las categorías de las variables que ponemos en el estudio
Gl= (Nº de categoría de la variable independiente (fumar)- 1) . (Nº de categoría de la
variable dependiente -1)
Gl= (k-1) . (L-1)= (2-1) . (2-1)= 1.1= 1
El test nos va a decir el nivel de significación.
1
2. Seminario 9 Estadística y TIC
Por ejemplo:
1. Un enfermero de la unidad de digestivo observa que se produce diferencias
relacionadas con los meses en los reingresos de pacientes con ulcera gástrica.
Recoge los siguientes datos:
E F M A M J J A S O N D
2 1 4 3 5 7 1 3 2 6 8 6
• Ho== no hay diferencias de reingresos en función del periodo del año
• Fe= 48 reingresos/ año= 48/12meses= 4 el valor esperado de reingreso
mensual.
• Valor real: E2, F1, M4, A3, M5, J7, J1, A3, S2, O6, N8, D6,
• No podemos utilizar la chi cuadrado, porque 4 < 5.
• Variable dependiente: mes del año
• Variable independiente: reingresos
• Reagrupar en estaciones (en SPSS: recodificar en distintas variables):
La variable dependiente la reagrupamos en 4 categorías
Invierno: 7
Primavera: 15
Verano: 6
Otoño: 20
• Gl= (4-1) . (2-1)= 3
• Total: 48 ; Fe: 48/4=12
Valores observados menos los esperados al cuadrado (ambos) entre los esperados (ver
libreta).
Mio: necesitamos saber el grado de libertad (GL) y el nivel de significación.
Cuando se rechaza la hipótesis nula H0, no es seguro 100% de que sea cierto→ asumir
probabilidad de error.
Si el enunciado no dice nada, asumimos el error alfa (error que se comete al rechazar la
H0)= 0,05%
Si p< 0,05% se RECHAZA la hipótesis.
Si p > 0,05% se ACEPTA la hipótesis.
Relación entre valor de chi cuadrado y p de error= relación inversa, es decir, a
mayor valor de chi cuadrado, menor valor de p.
Mi resultado obtenido (11,16) es mayor del que debería ser el valor de chi cuadrado
(7,82 tabla), por lo que p es menor de 0,05% y, por tanto, rechazo la hipótesis. Por lo
tanto, si hay diferencia de reingresos en f(x) del periodo del año.
Grados de libertad: n-1= 3
2
( ) ( ) ( ) ( ) ( )
2 2 2 2 2
2 7 12 15 12 6 12 20 12
11,16
12 12 12 12
fo fe
fe
χ
− − − − −
= = + + + =∑
3. Seminario 9 Estadística y TIC
A un nivel de significación de 0,05
H0: la incidencia de complicaciones de úlceras gástrica es la misma en todas las épocas
del año
χ2
= 11,6 obtenido mediante la fórmula a partir de los datos
Chi en la tabla: 7,82 (el modelo teórico: si la diferencia fuera sólo producto del
azar a un nivel de sig. 0,05 y 3GL)
Chi fórmula 11,6>Chi tabla 7,82
11, 6 es mayor que el resultado de las tablas 7,82 o lo que es lo mismo
hay más diferencia en los datos que la que habría sí la diferencia fuera
producto del azar.
rechazamos la Ho
O lo que es lo mismo la incidencia de complicaciones en las
ulceras gástricas no es la misma en los cuatro trimestres a un
nivel de significación del 0,05.
La Chi… para comparar dos variables…
Para comparar dos variables cualitativas: tabla de contingencia
Poner las frecuencias observadas (datos)
Calcular las frecuencias teóricas
Es importante caer en la cuenta de que la suma de las frecuencias
observadas debe ser igual a la suma de las frecuencias teóricas
3
4. Seminario 9 Estadística y TIC
Estas sumas (de todas las frecuencias observadas y de todas las
frecuencias teóricas) con frecuencia no son idénticas porque
redondeamos los decimales, pero deben ser muy parecidas
Calcular los grados de libertad
Procedimiento
Establecer la hipótesis nula
Realizar una tabla con los datos observados o frecuencias observadas
Calcular los grados de libertad
Calcular las frecuencias esperadas
Utilizar el estadístico
Compararlo con las tablas al nivel de significación fijado
Aceptar o rechazar la H0
Tabla de frecuencias teóricas
Ejemplo:
2. Se está estudiando la relación de complicaciones en la herida quirúrgica de dos
servicios hospitalarios (A, B). Para ello hemos recogido las observaciones de dos
servicios durante un periodo de tiempo
Ho: No hay diferencia entre los servicios (en los dos existe la misma
probabilidad de complicaciones de la herida quirúrgica)
H1: Existe diferencia entre los servicios
Queremos trabajar a un nivel de significación de 0,05 (95%)
DATOS OBSERVADOS
A B Total
Si C 4 9 13
No C 122 94 216
Total 126 103 229
4 + 9 + 122 + 94= 229
Se trata de calcular las frecuencias teóricas
4
2
2 ( )fo ft
ft
χ
−
= ∑
5. Seminario 9 Estadística y TIC
DATOS ESPERADOS
A B Total
Si C (126.13/229)= 7,15 (103.13/229)= 5,8
No C (126.216/229)= 118,8 (103.216/229)= 97,1
Total 228,85
7,15 + 5,8 + 118,8 + 97,1= 228,85
χ2
= Σ (O – E)2
/ E= (4 – 7,15)2
/ 7,15 + (9 – 5,8)2
/ 5,8 + (122 – 118,8)2
/ 118,8 + (94 –
97,1)2
/ 97,1= 1,387 + 1,765 + 0,086 + 0,098= 3,336
Como es tabla de 2 variables x 2 categorías = 1
(2 – 1).(2 – 1)= 1.1= 1 → 3,84 tendría que valer chi cuadrado.
El valor obtenido es menor que el valor para chi cuadrado; luego p es mayor, luego se
acepta la hipótesis.
3. Otro ejercicio….Inventa el tema de investigación y…. A un nivel de significación
de 0,001
Se está estudiando la efectividad de dos tratamientos (A y B) para las úlceras por
presión. Para ello hemos recogido los siguientes datos:
Ho: No hay diferencia en la eficacia de los tratamientos para la UPP.
H1: Existe diferencia entre los tratamientos.
Queremos trabajar a un nivel de significación de 0,001 (probabilidad de error de 1 por
1.000)
Chi= 27,9
DATOS OBSERVADOS
A B Total
Si Efectivo 20 70 90
No Efectivo 45 26 71
Total 65 96 161
DATOS ESPERADOS
A B
Si Efectivo (65.90/161)= 36,3354 (96.90/161)= 53,6645
No Efectivo (65.71/161)= 28,6645 (96.71/161)= 42,3354
Total 160,9998
χ2
= Σ (O – E)2
/ E= (20 – 36,3354)2
/ 36,3354 + (70 – 53,6645)2
/ 53,6645 + (45 –
28,6645)2
/ 28,6645 + (26 – 42,3354)2
/ 42,3354= 7,3439 + 4,9725 + 9,3093 + 6,3031=
27,9288
Grado de libertad= (2 – 1) . (2 – 1)= 1 . 1= 1
Buscar en la tabla de la χ2
a un nivel de significación del 0,001 y con un grado de
libertad el valor es = 10,83
5
6. Seminario 9 Estadística y TIC
Mi resultado obtenido (27,9) es mayor del que debería ser el valor de chi cuadrado
(10,83 tabla), por lo que p es menor de 0,001% y, por tanto, rechazo la hipótesis nula.
Por lo tanto, si hay diferencia de eficacia entre los dos tratamientos para la UPP.
El valor obtenido es mayor que el valor para chi cuadrado; luego p es menor, luego se
rechaza la hipótesis.
¿Qué tratamiento es mejor?
65 pacientes con tto A: 20 curados, 45 no curados
96 pacientes con tto B: 70 curados, 26 no curados
A: 20/161= 0,12
B: 70/161= 0,43 es mejor el B
4. Tenemos la siguiente tabla de contingencia que refleja los datos de la asignatura
de religión en centros escolares. ¿Influye el tipo de colegio en la nota obtenida?
Con un margen de error 0,05)
1. Formular las hipótesis
Ho: La nota de los dos colegios es igual ó lo que es lo mismo no hay diferencia
en la nota en relación al tipo de colegio
H1: La titularidad del colegio influye en la nota de religión
2. Calcular las frecuencias esperadas
DATOS OBSERVADOS
INSUF. SUF/BIEN NOTABLE SOBRESAL Total
C. Privado 6 14 17 9 46
Instituto 30 32 17 3 82
Total 36 46 34 12 128
DATOS ESPERADOS
INSUF. SUF/BIEN NOTABLE SOBRESAL Total
C. Privado 36.46/128=
14,0338
46.46/128=
16,5312
34.46/128=
12,2187
12.46/128=
4,3125
Instituto 36.82/128=
23,0625
46.82/128=
29,4687
34.82/128=
21,7812
12.82/128=
7,6875
Total
3. Calcular el valor de la Chi cuadrado= 17,3
χ2
= Σ (O – E)2
/ E= (6 – 14,03)2
/ 14,03 + (14 – 16,53)2
/ 16,53 + (17 – 12,22)2
/ 12,22 +
(9 – 4,31)2
/ 4,31 + (30 – 23,06)2
/ 23,06 + (32 – 29,47)2
/ 29,47 + (17 – 21,78)2
/ 21,78 +
(3 – 7,69)2
/ 7,69 = 4,5959 + 0,3872 + 1,8697 + 5,1035 + 2,0886 + 0,0858 + 1,049 +
2,8603= 18,04
Tb calcular el grado de libertad
GL= (2 – 1) . (4 – 1)=1.3= 3
4. Buscar la tabla a 0.95 (0.05) y 3 grados de libertad: 7,82
Buscar en la tabla de la χ2
a un nivel de significación del 0,05 y con grado de libertad de
3, el valor es = 7,82
6
7. Seminario 9 Estadística y TIC
5. Comparar el estadístico con el resultado de la tabla
17,3>7,8: por lo que podemos decir que el tipo de colegio influye en la nota de religión,
o lo que es lo mismo la diferencia observada no se debe al azar y por tanto se rechaza la
hipótesis nula de semejanza
Mi resultado obtenido (18,04) es mayor del que debería ser el valor de chi cuadrado
(7,82 tabla), por lo que p es menor de 0,05% y, por tanto, rechazo la hipótesis nula. Por
lo tanto, si hay diferencia en la nota en relación al tipo de colegio.
El valor obtenido es mayor que el valor para chi cuadrado; luego p es menor, luego se
rechaza la hipótesis nula.
5. Invéntate un ejercicio… con 8 grados de libertad.
Suponiendo que el estadístico que calculas sale 14
¿Qué decisión tomarías a un nivel de significación 0.05? Y a un nivel de
significación de 0.01?
(9 – 1) . (2 – 1)
(5 – 1) . (3 – 1) Este es mejor.
Ho: No hay relación entre el grupo de edad de los pacientes en un estudio y el grado de
satisfacción percibida con los servicios de enfermería.
Variable independiente: grupos de edad (0-15 años; 16-65 años; mayor de 65)
Variable dependiente: grado de satisfacción (5 niveles: muy satisfecho; satisfecho;
indiferente; Insatisfecho; muy insatisfecho)
χ2
= 14 (lo da el ejercicio)
gl→ p 0,05→ χ2
= 15,51. Lo aceptamos. Para 0,001 deberíamos saber que también lo
vamos a aceptar.
gl→ p 0,01→ χ2
= 20,09
6. En un grupo de enfermos que se quejaban de que no dormían se les dio
somníferos y placebos. Con los siguientes resultados. Nivel de significación: 0,05
¿Es lo mismo tomar somníferos o placebos para dormir bien o mal en este grupo de
enfermos?
Resultado: Chi cuadrado= 2,5778
Ho: No hay diferencia entre tomar placebos y somníferos a la hora de dormir
mejor.
H1: Existe diferencia entre los tratamientos a la hora de dormir mejor.
DATOS OBSERVADOS
Duermen bien Duermen mal Total
Somníferos (A) 44 10 54
Placebos (B) 81 35 116
Total 125 45 170
DATOS ESPERADOS
Duermen bien Duermen mal Total
Somníferos (A) 125.54/170=
39,7058
45.54/170=
14,2941
Placebos (B) 125.116/170= 45.116/170=
7
8. Seminario 9 Estadística y TIC
82,2941 30,7058
Total
χ2
= Σ (O – E)2
/ E= (44 – 39,7058)2
/ 39,7058 + (81 – 82,2941)2
/ 82,2941 + (10 –
14,2941)2
/ 14,2941 + (35 – 30,7058)2
/ 30,7058= 0,4644 + 0,0203 + 1,2899 + 0,6005=
2,3751
Grado de libertad= (2 – 1) . (2 – 1)= 1 . 1= 1
Buscar en la tabla de la χ2
a un nivel de significación del 0,05 y con un grado de libertad
el valor es = 3,84
Mi resultado obtenido (2,3751) es menor del que debería ser el valor de chi cuadrado
(3,84 tabla), por lo que p es mayor de 0,05% y, por tanto, acepto la hipótesis nula. Por
lo tanto, no hay diferencia entre tomar placebos y somníferos a la hora de dormir mejor.
El valor obtenido es menor que el valor para chi cuadrado; luego p es mayor, luego se
acepta la hipótesis.
7. En un C de Salud analizamos las historias de enfermería (292 hombres y 192
mujeres). De ellos tienen úlcera 10 hombres y 24 mujeres y no tienen 282 y 168
respectivamente. Nivel significación 0,05
- Formula la Ho.
- Calcula el estadístico
- ¿existe relación entre tener úlcera y el sexo?
1. Formular la H0: No hay diferencia entre hombres y mujeres a la hora de
presentar úlceras.
H1: existe diferencia entre hombre y mujeres a la hora de presentar úlceras.
2. Calcular las frecuencias esperadas
DATOS OBSERVADOS
Mujeres Hombres Total
Si U 24 10 34
No U 168 282 450
Total 192 292 484
DATOS ESPERADOS
Mujeres Hombres
Si U 192.34/484=
13,4876
292.34/484=
20,5123
No U 192.450/484=
178,5123
292.450/484=
271,4876
483,9998
3. Calcular el valor de la Chi cuadrado=
8
9. Seminario 9 Estadística y TIC
χ2
= Σ (O – E)2
/ E= (24 – 13,4876)2
/ 13,4876 + (10 – 20,5123)2
/ 20,5123 + (168 –
178,5123)2
/ 178,5123 + (292 – 271,4876)2
/ 271,4876= 8,1934 + 5,3874 + 0,619 +
1,5498= 15,7496
Grado de libertad= (2 – 1) . (2 – 1)= 1 . 1= 1
4. Buscar en la tabla de la χ2
: un nivel de significación del 0,05 y con un grado
de libertad, el valor es = 3,84
5. Comparar el estadístico con el resultado de la tabla
Mi resultado obtenido (15,7496) es mayor del que debería ser el valor de chi cuadrado
(3,84 tabla), por lo que p es menor de 0,05% y, por tanto, rechazo la hipótesis nula. Por
lo tanto, si hay diferencia entre hombres y mujeres a la hora de presentar úlceras.
El valor obtenido es mayor que el valor para chi cuadrado; luego p es menor, luego se
rechaza la hipótesis nula.
15,7496 >3,84: por lo que podemos decir que el sexo influye en la presentación de
úlceras, o lo que es lo mismo la diferencia observada no se debe al azar y por tanto se
rechaza la hipótesis nula de semejanza.
9
10. Seminario 9 Estadística y TIC
χ2
= Σ (O – E)2
/ E= (24 – 13,4876)2
/ 13,4876 + (10 – 20,5123)2
/ 20,5123 + (168 –
178,5123)2
/ 178,5123 + (292 – 271,4876)2
/ 271,4876= 8,1934 + 5,3874 + 0,619 +
1,5498= 15,7496
Grado de libertad= (2 – 1) . (2 – 1)= 1 . 1= 1
4. Buscar en la tabla de la χ2
: un nivel de significación del 0,05 y con un grado
de libertad, el valor es = 3,84
5. Comparar el estadístico con el resultado de la tabla
Mi resultado obtenido (15,7496) es mayor del que debería ser el valor de chi cuadrado
(3,84 tabla), por lo que p es menor de 0,05% y, por tanto, rechazo la hipótesis nula. Por
lo tanto, si hay diferencia entre hombres y mujeres a la hora de presentar úlceras.
El valor obtenido es mayor que el valor para chi cuadrado; luego p es menor, luego se
rechaza la hipótesis nula.
15,7496 >3,84: por lo que podemos decir que el sexo influye en la presentación de
úlceras, o lo que es lo mismo la diferencia observada no se debe al azar y por tanto se
rechaza la hipótesis nula de semejanza.
9