You are on page 1of 11

CONTRASTES DE HIPTESIS

NO PARAMTRICOS
Parte 1: Asociados a la 2

CONTRASTES DE HIPTESIS
NO PARAMTRICOS
Los contrastes de hiptesis de la Inferencia Paramtrica tratan de inferir propiedades sobre uno (o varios)
parmetros de cierta poblacin, cuya distribucin quedar determinada cuando se sepan los parmetros.
Las hiptesis necesarias para la validez de los procedimientos descritos en la Inferencia Paramtrica
(normalidad, independencia, tamaos de muestra, ) no siempre se satisfacen, y por ello son necesarios
procedimientos que sean ms flexibles de aplicar.
Los llamados mtodos no paramtricos llenan esta laguna, siendo su validez mucho ms general. Sus
principales ventajas son:
Dado que tienen menos hiptesis iniciales que cumplir para su aplicacin, es improbable usarlos
inadecuadamente, esto es, son inocuos.
Los clculos suelen ser ms simples y rpidos.
No requieren como en los paramtricos escalas numricas (razn o intervalo). A la mayora le basta
con la escala ordinal (o de rangos).
Tambin tienen inconvenientes. El principal es que desperdician mucha informacin, y por ello deben
usarse si no existe una alternativa paramtrica.
De la amplia variedad existente, veremos contrastes no paramtricos:
Para analizar datos de frecuencias en problemas de independencia, homogeneidad y ajuste a
una distribucin, todos asociados a la distribucin chi-cuadrado. (Parte 1)
Para analizar problemas no paramtricos con una muestra.
(Parte 2)
Para analizar problemas no paramtricos con dos o ms muestras.

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
A) Contraste de independencia entre variables discretas:
Si se tiene una muestra de N individuos de una poblacin, en los que se ha medido en cada
individuo qu valores o categoras tienen segn dos variables discretas, los datos de
frecuencias en cada pareja de valores o categoras se pueden disponer en la tabla:
donde nij representan las frecuencias
VAR. II
observadas en cada pareja de posibles
VAR. I
1
2
J

valores de VAR. I y VAR. II, y las ltimas fila y


1

n1
n11
n1J
n12
columna representan las sumas de filas y
2

n2
n21
n2J
n22
columnas (frecuencias marginales).

nij

nI1

nI2

nIJ

nI

n1

n2

nJ

En este contexto, el contraste (unilateral) que


decide sobre la independencia de las dos
variables tiene por hiptesis, EC y RC:

H0 Las var iables I y II son independie ntes

2
I
J (nij Eij )
I
J nij
X
=
=
N

exp
i = 1 j =1
i =1 j = 1
Eij
Eij
H1 Las var iables I y II NO son independie ntes

donde Eij =

ni n j

son las frecuencias esperadas en cada casilla si fuera cierta H0


debiendo exigirse para aplicar el contraste
y la regin crtica es RC = X 2exp > 12 [(I 1) ( J 1)] frecuencias esperadas de al menos 5
N

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
Ejemplo
Un investigador est
interesado en analizar en una poblacin si las dos
caractersticas fsicas de color del pelo y tonalidad de la piel son independientes.
Para ello toma una muestra de 70 individuos, obteniendo la siguiente tabla:
ni j

COLOR DEL PELO

TONALIDAD PIEL

Negro

Castao

Rubio

Oscura

20

20

Clara

10

10

Qu debe concluirse en base a estos


datos?

Solucin:
Para decidir si las variables son independientes, tiene sentido plantear el contraste:
ni n j
Las
frecuencias
esperadas
son
=
E
H0 Las dos var iables son independientes
ij

H1 Las dos var iables no son independientes

X2exp

nij2
I
J
i=1 j=1
Eij

N=

202 + L + 102
16.1
5.4

y si tomamos =0.05,

70 = 8.84

} {

Ei j

COLOR DEL PELO

TONALIDAD PIEL

Negro

Castao

Rubio

Oscura

16.1

19.3

9.6

Clara

8.9

10.7

5.4

} {

RC = X 2exp > 12 [(I 1) ( J 1)] = X 2exp > 20.95 (2 ) = X 2exp > 5.99

Como X2 expRC rechazamos H0 (Existe dependencia entre las variables)

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
B) Contraste de homogeneidad entre poblaciones:
Si se tiene una misma variable discreta distribuida en varias poblaciones, y extraemos una
muestra de cada poblacin, disponiendo los datos de frecuencias en la tabla:
donde nij representan las frecuencias
observadas en cada muestra de los valores
de la VARIABLE, y las ltimas fila y columna
representan las sumas de filas y columnas
(frecuencias marginales).

VARIABLE
POBLACIONES

Muestra 1

n11

n12

n1J

n1

Muestra 2

n21

n22

n2J

n2

nij

Muestra I

nI1

nI2

nIJ

nI

n1

n2

nJ

En este contexto, el contraste (unilateral) que


decide sobre la independencia de las dos
variables tiene por hiptesis, EC y RC:

H0 Las poblaciones son homogneas respecto a la VARIABLE


H1 Las poblaciones NO son homogneas respecto a la VARIABLE

(nij Eij )2

ni n j

donde Eij =
son las frecuencias
N
X 2exp = Ii =1 Jj =1
= Ii =1 Jj =1
N
esperadas en cada casilla si fuera cierta H0
Eij
Eij
debiendo exigirse para aplicar el contraste
y la regin crtica es RC = X 2exp > 12 [(I 1) ( J 1)] frecuencias esperadas de al menos 5

nij

CONTRASTES DE HIPTESIS E
INTERVALOS DE CONFIANZA
PARA COMPARAR DOS POBLACIONES
Ejemplo
Se quiere comprobar si las provincias de Cdiz, Sevilla y Huelva son homogneas respecto al
nmero de vacunados contra la poliomelitis. Para ello se obtuvieron muestras de cada
provincia con los resultados de la tabla siguiente. Qu puede concluirse?
ni j

VACUNADOS

PROVINCIAS

SI

NO

NS/NC

Cdiz

60

12

12

Huelva

45

15

Sevilla

120

21

Solucin:
Para comprobar si existe homogeneidad entre las
provincias, tiene sentido plantear el contraste:
H0 Las Prov. son homogneas respecto a la VACUNACIN
H1 Las Prov. NO son homogneas respecto a la VACUNACIN
Ei j

Las frecuencias esperadas


Eij =

ni n j
N

son las de la tabla:

y si tomamos =0.05,

PROVINCIAS

A partir de aqu, el EC:

VACUNADOS
SI

NO

NS/NC

Cdiz

63

10.08

10.92

Huelva

49.5

7.92

8.58

Sevilla

112.5

18

19.5

} {

} {

X 2exp
=

602
63

nij2
I
J
i = 1 j = 1
Eij
2

N=

21 300 = 13.24
+ L + 19
.5

RC = X 2exp > 12 [(I 1) ( J 1)] = X 2exp > 20.95 (4 ) = X 2exp > 9.49

Como X2 expRC rechazamos H0 (Las provincias no son homogneas)

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
C) Contraste de la 2 de ajuste a una distribucin:
Nos permite decidir si frecuencias observadas en una poblacin son compatibles con un
modelo de distribucin F. Se parte de obtener la tabla de frecuencias observadas para
cada valor (si la distribucin F es discreta) o para cada intervalo de valores (si la
distribucin F es continua):
VARIABLE
Valores o intervalos

C1

C2

CI

Frecuencias observadas

n1

n2

nI

En este contexto, el contraste (unilateral) que


decide sobre si estas frecuencias se ajustan a
la distribucin F tiene por hiptesis, EC y RC:

H0 La distribucin de la poblacin es F
H1 La distribucin de la poblacin no es F
Deben primero calcularse, con la distribucin terica F, la probabilidad de cada valor o
intervalo Ci: pi = P[X Ci], siendo Ii =1pi = 1 , y a partir de ah:
X 2exp

(n
Ii =1 i

Npi )2
n
= Ii =1 i N
Npi
Npi

y la regin crtica es RC = X 2exp > 12 (I 1 k )

donde N es el tamao de la muestra y k es el nmero de parmetros que hay que


estimar en la distribucin terica F (si stos fueran desconocidos).
La correcta aplicacin del contraste exige N>30 y frecuencias esperadas Npi superiores a 1

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
Ejemplo 1
En los ltimos
premiado ha sido:

100

CIFRAS
Frec.

0
6

sorteos
1
12

de

2
9

la

O.N.C.E.,

3
7

4
14

5
12

la

ltima

6
13

7
8

cifra
8
4

del

nmero

9
15

Se ajustan estas frecuencias empricas a la distribucin terica que les correspondera?.

Solucin:
La distribucin terica para los valores de esta variable es la distribucin uniforme, es decir, todos
los valores deberan tener la misma probabilidad P[X=k] = 1/10 k=0,1,,9. El contraste sera:
H0 La distribucin de la poblacin es uniforme con p=1/10
H1 La distribucin de la poblacin no es la anterior
CIFRAS 0
ni
Npi

1
12

10 10

2
9

7 14

12

13

10 10 10

10

10

10 10 10

y la regin crtica es

La tabla de frecuencias observadas


y esperadas, el EC y la RC son:

15

X 2exp

n
iI=1 i

} {

Npi

N=

62
10

+ L + 15
100 = 12.4
10

} {

RC = X 2exp > 12 (I 1 k ) = X 2exp > 12 (9) = X 2exp > 16.9

Como X2 exp RC aceptamos H0 (Estos valores se ajustan a la distribucin uniforme)

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
Ejemplo 2
Se ajustan estas frecuencias empricas a la distribucin binomial?.
X
Frec.

0
30

1
62

2
46

3
10

4
2

Solucin:
Si tenemos que ajustar estos datos a una binomial, por los valores que toma X (de 0 a 4), debe ser
una Bi(4; ). Para obtener el valor de , podemos estimarlo a partir de la media muestral, teniendo
en cuenta que = n x . Como x =1.28, p=0.32, por tanto el contraste se puede formular:
H0 La distribucin de la poblacin es Bi(4; 0.32)
H1 La distribucin de la poblacin no es la anterior
X
ni
pi
Npi

0
1
30
62
0.2138 0.402
32.1
60.3

y la regin crtica es

2
46
0.284
42.6

3
4
10
2
0.089 0.0104
13.3
1.6

La tabla de frecuencias observadas


y esperadas, el EC y la RC son:

X 2exp

} {

n
iI=1 i

Npi

N=

302 + L + 22
32.1
1 .6

} {

150 = 1.475

RC = X 2exp > 12 (I 1 k ) = X 2exp > 20.95 (5 1 1) = X 2exp > 7.81

Como X2 exp RC aceptamos H0 (Estos valores se ajustan a la distribucin binomial)

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
Ejemplo 3
El nmero de accidentes mortales por da, en una ciudad, fue contabilizado durante 100 das,
ofreciendo el estudio los siguientes resultados:
ACCIDENTES
N de das

0
25

1
36

2
22

3
11

4
5

5
1

Se ajustan estas frecuencias a una distribucin de Poisson?.

Solucin:

Para ajustar a una distribucin de Poisson, estimamos el parmetro a travs de la media


muestral. Como x = 1.38, la distribucin terica es P(1.38). El contraste sera:
La tabla de frecuencias observadas
H0 La distribucin de la poblacin es P(1.38)
y esperadas, el EC y la RC son:
H La distribucin de la poblacin no es la anterior
1

ACCIDENTES
0
1
2
3
4
5
ni
25
36
22
11
5
1
pi
0.2515 0.3472 0.2396 0.1102 0.038 0.0105
Npi
25.15 34.72 23.96 11.02
3.8
1.05

y la regin crtica es

} {

X 2exp
=

25 2
25.15

n
iI=1 i

Npi

N=

+ L + 11.05 100 = 0.8799

} {

RC = X 2exp > 12 (I 1 k ) = X 2exp > 20.95 (4) = X 2exp > 9.49

Como X2 exp RC aceptamos H0 (Estos valores se ajustan a la distribucin de Poisson)

CONTRASTES DE HIPTESIS ASOCIADOS A LA


DISTRIBUCIN CHI-CUADRADO
Ejemplo 4
Medida la hemoglobina en gr/100ml de sangre en 100 hombres adultos normales, se obtuvieron
los siguientes datos:
Se ajustan estos datos a la distribucin Normal?.
HEMOGLOBINA N DE HOMBRES
13.5 14.5
10
14.5 15.5
22
15.5 16.5
35
16.5 17.5
24
17.5 18.5
9

Solucin:
La distribucin terica a la que ajustar es Normal, pero tenemos
que saber la media y desviacin tpica. Podemos estimar estos
parmetros con x =16 y s=1.11. El contraste por tanto sera:

H0 La distribucin de la poblacin es N(16; 1.11)


H1 La distribucin de la poblacin no es la anterior
HEMOGLOBINA
13.5 14.5
14.5 15.5
15.5 16.5
16.5 17.5
17.5 18.5

ni
10
22
35
24
9

PROBAILIDADES
P[X 14.5]= 0.0885
P[14.5 < X 15.5]= 0.2379
P[15.5 < X 16.5]= 0.3472
P[16.5 < X 17.5]= 0.2379
P[17.5 < X]= 0.0885

Npi
8.85
23.79
34.72
23.79
8.85

La tabla de frecuencias observadas


y esperadas, el EC y la RC son:

X 2exp = iI=1

ni2
N=
Npi

102
8.85

+ L + 89.85 100 = 0.2907

y la regin crtica es

} {

} {

RC = X 2exp > 12 (I 1 k ) = X 2exp > 12 (2) = X 2exp > 5.99

Como X2 exp RC aceptamos H0 (Estos valores se ajustan a la distribucin Normal)

You might also like