Professional Documents
Culture Documents
NO PARAMTRICOS
Parte 1: Asociados a la 2
CONTRASTES DE HIPTESIS
NO PARAMTRICOS
Los contrastes de hiptesis de la Inferencia Paramtrica tratan de inferir propiedades sobre uno (o varios)
parmetros de cierta poblacin, cuya distribucin quedar determinada cuando se sepan los parmetros.
Las hiptesis necesarias para la validez de los procedimientos descritos en la Inferencia Paramtrica
(normalidad, independencia, tamaos de muestra, ) no siempre se satisfacen, y por ello son necesarios
procedimientos que sean ms flexibles de aplicar.
Los llamados mtodos no paramtricos llenan esta laguna, siendo su validez mucho ms general. Sus
principales ventajas son:
Dado que tienen menos hiptesis iniciales que cumplir para su aplicacin, es improbable usarlos
inadecuadamente, esto es, son inocuos.
Los clculos suelen ser ms simples y rpidos.
No requieren como en los paramtricos escalas numricas (razn o intervalo). A la mayora le basta
con la escala ordinal (o de rangos).
Tambin tienen inconvenientes. El principal es que desperdician mucha informacin, y por ello deben
usarse si no existe una alternativa paramtrica.
De la amplia variedad existente, veremos contrastes no paramtricos:
Para analizar datos de frecuencias en problemas de independencia, homogeneidad y ajuste a
una distribucin, todos asociados a la distribucin chi-cuadrado. (Parte 1)
Para analizar problemas no paramtricos con una muestra.
(Parte 2)
Para analizar problemas no paramtricos con dos o ms muestras.
n1
n11
n1J
n12
columna representan las sumas de filas y
2
n2
n21
n2J
n22
columnas (frecuencias marginales).
nij
nI1
nI2
nIJ
nI
n1
n2
nJ
2
I
J (nij Eij )
I
J nij
X
=
=
N
exp
i = 1 j =1
i =1 j = 1
Eij
Eij
H1 Las var iables I y II NO son independie ntes
donde Eij =
ni n j
TONALIDAD PIEL
Negro
Castao
Rubio
Oscura
20
20
Clara
10
10
Solucin:
Para decidir si las variables son independientes, tiene sentido plantear el contraste:
ni n j
Las
frecuencias
esperadas
son
=
E
H0 Las dos var iables son independientes
ij
X2exp
nij2
I
J
i=1 j=1
Eij
N=
202 + L + 102
16.1
5.4
y si tomamos =0.05,
70 = 8.84
} {
Ei j
TONALIDAD PIEL
Negro
Castao
Rubio
Oscura
16.1
19.3
9.6
Clara
8.9
10.7
5.4
} {
RC = X 2exp > 12 [(I 1) ( J 1)] = X 2exp > 20.95 (2 ) = X 2exp > 5.99
VARIABLE
POBLACIONES
Muestra 1
n11
n12
n1J
n1
Muestra 2
n21
n22
n2J
n2
nij
Muestra I
nI1
nI2
nIJ
nI
n1
n2
nJ
(nij Eij )2
ni n j
donde Eij =
son las frecuencias
N
X 2exp = Ii =1 Jj =1
= Ii =1 Jj =1
N
esperadas en cada casilla si fuera cierta H0
Eij
Eij
debiendo exigirse para aplicar el contraste
y la regin crtica es RC = X 2exp > 12 [(I 1) ( J 1)] frecuencias esperadas de al menos 5
nij
CONTRASTES DE HIPTESIS E
INTERVALOS DE CONFIANZA
PARA COMPARAR DOS POBLACIONES
Ejemplo
Se quiere comprobar si las provincias de Cdiz, Sevilla y Huelva son homogneas respecto al
nmero de vacunados contra la poliomelitis. Para ello se obtuvieron muestras de cada
provincia con los resultados de la tabla siguiente. Qu puede concluirse?
ni j
VACUNADOS
PROVINCIAS
SI
NO
NS/NC
Cdiz
60
12
12
Huelva
45
15
Sevilla
120
21
Solucin:
Para comprobar si existe homogeneidad entre las
provincias, tiene sentido plantear el contraste:
H0 Las Prov. son homogneas respecto a la VACUNACIN
H1 Las Prov. NO son homogneas respecto a la VACUNACIN
Ei j
ni n j
N
y si tomamos =0.05,
PROVINCIAS
VACUNADOS
SI
NO
NS/NC
Cdiz
63
10.08
10.92
Huelva
49.5
7.92
8.58
Sevilla
112.5
18
19.5
} {
} {
X 2exp
=
602
63
nij2
I
J
i = 1 j = 1
Eij
2
N=
21 300 = 13.24
+ L + 19
.5
RC = X 2exp > 12 [(I 1) ( J 1)] = X 2exp > 20.95 (4 ) = X 2exp > 9.49
C1
C2
CI
Frecuencias observadas
n1
n2
nI
H0 La distribucin de la poblacin es F
H1 La distribucin de la poblacin no es F
Deben primero calcularse, con la distribucin terica F, la probabilidad de cada valor o
intervalo Ci: pi = P[X Ci], siendo Ii =1pi = 1 , y a partir de ah:
X 2exp
(n
Ii =1 i
Npi )2
n
= Ii =1 i N
Npi
Npi
100
CIFRAS
Frec.
0
6
sorteos
1
12
de
2
9
la
O.N.C.E.,
3
7
4
14
5
12
la
ltima
6
13
7
8
cifra
8
4
del
nmero
9
15
Solucin:
La distribucin terica para los valores de esta variable es la distribucin uniforme, es decir, todos
los valores deberan tener la misma probabilidad P[X=k] = 1/10 k=0,1,,9. El contraste sera:
H0 La distribucin de la poblacin es uniforme con p=1/10
H1 La distribucin de la poblacin no es la anterior
CIFRAS 0
ni
Npi
1
12
10 10
2
9
7 14
12
13
10 10 10
10
10
10 10 10
y la regin crtica es
15
X 2exp
n
iI=1 i
} {
Npi
N=
62
10
+ L + 15
100 = 12.4
10
} {
0
30
1
62
2
46
3
10
4
2
Solucin:
Si tenemos que ajustar estos datos a una binomial, por los valores que toma X (de 0 a 4), debe ser
una Bi(4; ). Para obtener el valor de , podemos estimarlo a partir de la media muestral, teniendo
en cuenta que = n x . Como x =1.28, p=0.32, por tanto el contraste se puede formular:
H0 La distribucin de la poblacin es Bi(4; 0.32)
H1 La distribucin de la poblacin no es la anterior
X
ni
pi
Npi
0
1
30
62
0.2138 0.402
32.1
60.3
y la regin crtica es
2
46
0.284
42.6
3
4
10
2
0.089 0.0104
13.3
1.6
X 2exp
} {
n
iI=1 i
Npi
N=
302 + L + 22
32.1
1 .6
} {
150 = 1.475
0
25
1
36
2
22
3
11
4
5
5
1
Solucin:
ACCIDENTES
0
1
2
3
4
5
ni
25
36
22
11
5
1
pi
0.2515 0.3472 0.2396 0.1102 0.038 0.0105
Npi
25.15 34.72 23.96 11.02
3.8
1.05
y la regin crtica es
} {
X 2exp
=
25 2
25.15
n
iI=1 i
Npi
N=
} {
Solucin:
La distribucin terica a la que ajustar es Normal, pero tenemos
que saber la media y desviacin tpica. Podemos estimar estos
parmetros con x =16 y s=1.11. El contraste por tanto sera:
ni
10
22
35
24
9
PROBAILIDADES
P[X 14.5]= 0.0885
P[14.5 < X 15.5]= 0.2379
P[15.5 < X 16.5]= 0.3472
P[16.5 < X 17.5]= 0.2379
P[17.5 < X]= 0.0885
Npi
8.85
23.79
34.72
23.79
8.85
X 2exp = iI=1
ni2
N=
Npi
102
8.85
y la regin crtica es
} {
} {