You are on page 1of 59

ESTADISTICA NO PARAMETRICA

ESTADSTICA NO PARAMTRICA

VENTAJAS
No se requiere de los
supuestos paramtricos
Se puede usar para
variables no numricas.
Clculos fciles,
originados por tamaos
de muestra pequeos.
Son convenientes
cuando no se conoce la
distribucin de la
poblacin.

DESVENTAJAS
Utilizan menor informacin
de la variable.
Es menos potente que los
resultados obtenidos en los
mtodos paramtricos.

ESTADISTICA
Test de hiptesis

Paramtricos: hiptesis sobre los


parmetros que definen la poblacin (por ej., pobl. Normales, y
tests sobre la media o la desv.
tpica).

No paramtricos: no se
refieren a parmetros de
la poblacin; se aplican
tpicamente cuando no
conocemos la distribucin
de la poblacin, o cuando su
distribucin es no normal.

CULES SON LAS SUPOSICIONES DE LA ESTADSTICA


NO PARAMTRICA?
Para realizar anlisis no paramtricos, debe partirse de las
siguientes consideraciones:
La mayora de estos anlisis no requieren de supuestos acerca
de la forma de la distribucin poblacional. Aceptan
distribuciones no normales.
Las variables no necesariamente deben estar medidas en un
nivel por intervalo o de razn, pueden analizar datos nominales
u ordinales.
Si se quiere aplicar anlisis no paramtrica a datos por
intervalos o razn, stos deben ser resumidos a categoras
discretas (intervalos). Las variables deben ser categoras.

Algunas Pruebas o Mtodos No Paramtricas:

Prueba Chi-Cuadrado.
Prueba de Signos
Prueba de Rangos Signados de Wilcoxon,
Prueba de Mann y Whitney
Prueba de Kruskal Wallis
Prueba de Correlacin
Prueba de Kolgomorov Smirnov

Distribucin Ji-Cuadrada o Chi-cuadrada o X2?.


Es una prueba til para variables categricas y
estadstica, es aplicable cuando la variable nominal
est compuesto por dos o ms categoras. Tiene dos
aplicaciones:
1. La prueba de bondad de ajuste Chi-cuadrada.
2. La prueba Chi-cuadrada de asociacin.
Ambas pruebas se utilizan para determinar si las
frecuencias observadas (O) en las categoras difieren
significativamente de las frecuencias esperadas (E).

Es una prueba estadstica para evaluar hiptesis


acerca de la relacin entre dos variables categricas.
Smbolo:

X2

Hiptesis a probar:

Correlaciones

Variables
involucradas:

Dos variables (la prueba Chi-cuadrada no


considera relaciones causales).

Nivel de medicin de
las variables

Nominal u ordinal (o intervalos o razn reducidas


a ordinales)

Procedimiento

Chi-cuadrada se calcula por medio de una tabla


de contingencia o tabulacin cruzada, que es
una tabla de dos dimensiones y cada dimensin
contiene una variable. A su vez, cada variable se
subdivide en dos o ms categoras.

CARACTERSTICAS
1. La Distribucin X2 se lee con grados de libertad G.L =
(N de filas - 1)(N de columnas - 1).
2. No tiene valores negativos. El valor mnimo es 0.
3. Todas las curvas son asimtricas
4. Cuando aumentan los grados de libertad las curvas son
menos elevadas y ms extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal u
ordinal.
6. Las frmulas son:

Total de Fila x Total de Columna


F. Esperada=
Total General

Prueba de hiptesis:
Determinar si las variables del estudio son independientes o no entre ellas

H0:

No existe relacin entre las variables del estudio

H1:

Existe relacin entre las variables del estudio

Si

X2obtenido

X2crtico entonces variables no son independientes; es

decir existe una relacin entre las variables

X2obtenido X2crtico

entonces se rechaza la hiptesis nula (H0), y


por lo tanto se acepta la hiptesis alterna (H1).

Paso N 1

Paso N 2

Paso N 3

Paso N 4

Establezca la Ho a ser probada; por ejemplo,


Ho: 1 = 2 = 0,5
Especifique el nivel de significancia , por ejemplo: = 0.5

Haga una tabla de frecuencias obtenidas


Deduzca las frecuencias esperadas a partir de Ho:
Calcule el grado de libertad: Producto de (categoras - 1)
Calcule el valor de X2 a partir de las frecuencias obtenidas y
frecuencias esperadas.
Mediante la tabla de X2 obtenga el valor terico.
Compara dichos valores.

Establezca la conclusin con respecto a Ho:


Rechaza Ho si valor de tabla > Valor calculado no estn relacionadas
Acepta Ho si valor de tabla < Valor calculado estn relacionadas

Chi Cuadrado :

Pruebas de Bondad de Ajuste

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una
forma de distribucin particular planteada como hiptesis. Si el ajuste es
razonablemente cercano, puede concluirse que si existe la forma de distribucin
planteada como hiptesis.
Prueba chi-cuadrada
donde k: Nmero de categoras o clases
k-m-1: grados de libertad donde m es el nmero de parmetros a estimar.
EJERCICIO:
Juan Prez, director de Mercadeo de Alden de Jurez, tiene la responsabilidad de
controlar el nivel de existencias para cuatro tipos de automviles vendidos por la
firma. En el pasado, ha ordenado nuevos automviles bajo la premisa de que los
cuatro tipos son igualmente populares y la demanda de cada tipo es la misma. Sin
embargo, recientemente las existencias se han vuelto ms difciles de controlar, y
Juan considera que debera probar su hiptesis respecto a una demanda uniforme.
Sus hiptesis son:
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.

Muestra la expectativa uniforme para una muestra de 48 autos vendidos


durante el ltimo mes
Registro de Ventas de Alden de Jurez
Tipo de auto
Kia
Fiesta
Focus
Clio

Ventas observadas
15
11
10
12

Ventas esperadas
12
12
12
12

Debido a que no hay parmetros que estimarse el nmero de grados de


libertad es k-1 = 3 grados de libertad.
Si Juan deseara probar al nivel del 5%, se encontrara, como se muestra

Regla de decisin: " No rechazar si

7.815. Rechazar si

7.815"

Como 1.17 < 7.815, la hiptesis de que la demanda no es uniforme no se rechaza.

Ejemplo 1. Variable, categora y tabla de contingencia 2x2:


Sean las variables TIPO CUENTA (Corriente y Vista) y
CLIENTE (Premiun y Vip). La tabla de contingencia o
tabulacin cruzada es:
CLIENTE
PREMIUN

Corriente
TIPO
CUENTA
Vista

VIP

20

30

40

25

Variable

Categora

CLIENTE
PREMIUN

Corriente

TIPO
CUENTA
Vista

VIP

20

30

40

25

Ejemplo 2. Estudio de Tabla de contingencia 3x2:

Se estudia a 1040 estudiantes de los niveles de educacin


primaria y secundaria y a los cuales se aplica un instrumento
que mide el aprendizaje de la matemtica, en las dimensiones
de aprendizaje conceptual, procedimental y actitudinal.
Variables:
APRENDIZAJE
categoras: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIN
categoras: Primaria, Secundaria.
TABLA DE CONTINGENCIA

NIVEL DE EDUCACIN
Primaria
APRENDIZAJE

Secundaria

Conceptual

180

100

Procedimental

190

280

Actitudinal

170

120

Tabla de frecuencias observadas (O):


NIVEL DE EDUCACIN

APRENDIZAJE

Conceptual
Procedimental

Actitudinal
TOTAL

TOTAL

Primaria

Secundaria

180

100

280

190

280

470

170

120

290

540

500

1040

Chi-cuadrada es una comparacin entre las tablas de


frecuencias observadas y la denominada tabla de
frecuencias esperadas (la tabla que esperaramos
encontrar si las variables fueran estadsticamente
independientes o no estuvieran relacionadas).

Tabla de frecuencias esperadas (E):


La frecuencia esperada de cada celda, casilla o recuadro, se
calcula mediante la siguiente frmula aplicada a la tabla de
frecuencias observadas:
N = es el nmero total de frecuencias observadas.
E = (marginal del regln)(marginal de columna) / N.
NIVEL DE EDUCACIN
Primaria
Conceptual (280)(540)/1040
APRENDIZAJE

Procedimental (470)(540)/1040
Actitudinal (290)(540)/1040
marginal de columnas

540

Secundaria

Marginal
de filas

(280)(500)/1040

280

(470)( 500)/1040

470

(290)(500)/1040

290

500

1040

Frecuencia observada:
NIVEL DE EDUCACIN
Primaria

APRENDI
ZAJE

TOTAL

secundaria

Conceptual

180

100

280

Procedimental

190

280

470

Actitudinal

170

120

290

540

500

1040

Donde:
O: frecuencia observada
en cada celda
E: frecuencia esperada
en cada celda

TOTAL

Frecuencia esperada:
NIVEL DE EDUCACIN
Primaria
APRENDIZ
AJE

TOTAL

Secundaria

Conceptual

145,4

134,6

280

Procedimental

244,0

226,0

470

Actitudinal

150,6

139,4

290

540

500

1040

TOTAL

X2

O-E

(O-E)2

(O-E)2 / E

Conceptual/Primaria

180

145,4

34,6

1197,16

8,23

Procedimental/ Primaria

190

244,4

-54,4

2959,36

12,11

Actitudinal / Primaria

170

150,6

19,4

376,36

2,50

Conceptual / Secundaria

100

134,6

-34,6

1197,16

8,69

Procedimental /Secundaria

280

226,0

54,0

2916,00

12,80

Actitudinal / Secundaria

120

139,4

-19,4

376,36

2,70

Celda

X2 =

47,33

Para saber si el valor de X2 es o no significativo, debemos


calcular los grados de libertad.
G.L. = (N de filas - 1)(N de columnas - 1).

Para el ejemplo: N de filas = 3 y


G.L. = (3-1)(2-1) = 2.

N de columnas

= 2; entonces

Luego, acudimos a la tabla de distribucin de Chicuadrado, eligiendo nuestro nivel de confianza ( = 0,05
= 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la
tabla, decimos que las variables estn relacionadas o no
son independientes.

Aplicacin:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla
es 5,9915 (ver tabla).
X2Obtenido = 47,33
X2Crtico = 5,9915 tabla

Prueba de hiptesis:

H0:

No existe relacin entre el aprendizaje y los


niveles de educacin.

H1:

Existe relacin entre el aprendizaje y niveles de


educacin.

X2obtenido

X2crtico

entonces se rechaza la
hiptesis nula (H0), y por lo tanto se acepta la hiptesis
alterna (H1).

X2obtenido

X2crtico

entonces variables no son


independientes; es decir existe una relacin entre
Aprendizaje y los niveles educativos

Ejercicio:
Una fabrica est pensando en implantar uno de los tres sistemas de calificaciones
para el desempeo: (1) todas las calificaciones son aprobados-reprobado; (2) todas
las calificaciones estn en el sistema 4.0 y (3) 90% de las calificaciones estn en el
sistema 4.0 y 10% son a aprobados-reprobado. Se realiza una encuesta para
determinar si existe una relacin entre el rea de laboral de cada trabajador y su
preferencia para algn sistema de calificacin. Se elige una muestra aleatoria de
200 trabajadores del rea operaciones, 200 administrativos, y 100 de produccin.
Se pregunta a cada trabajador cul de los tres sistemas de calificaciones prefieren.
Los resultados aparecen en la siguiente tabla:
Sistema Calificacin Desempeo
Aprobado-reprobado

4,0

4,0 y aprobado-reprobado

Produccin

26

55

19

Administrativos

24

118

58

Operaciones

20

112

68

a). Cul es la hiptesis nula e hiptesis alterna?


c). Cul es la conclusin?. Utilice = 0,01.

Ejercicio:

Un investigador cree que, durante los ltimos aos, la composicin


tnica de la ciudad donde vive ha cambiado. Las cifras ms actuales
(reunidas hace unos cuntos aos) muestran que los habitantes de
dicha ciudad presentan la siguiente composicin tnica: 53% noruegos,
32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar
esta idea, este cientfico social obtiene una muestra aleatoria de 750
habitantes, con los resultados que se presentan en la siguiente tabla:
Pases

frecuencia

Noruegos

Suecos

399

193

Irlandeses Alemanes

63

Italianos

82

a). Cul es la hiptesis nula e hiptesis alternativa?


c). Cul es la conclusin?. Utilice = 0,01.

13

Ejercicio:
Debido a la inflacin, el gobierno est considerando la imposicin de un control
de precios y salarios. Un economista del gobierno, interesado en determinar si
existe una relacin entre el empleo y la actitud hacia este control, rene los
siguientes datos. Los datos muestran, para cada tipo de empleo, el nmero de
individuos en la muestra que estn a favor o contra de los controles.
Actitud hacia el control de precios y salarios
A favor
En contra
Obreros

90

60

Empresarios

100

150

Profesionales

110

90

a). Cul es la hiptesis nula?


b). Cul es la hiptesis alterna?

c). Cul es la conclusin?. Utilice = 0,03.

EJERCICIO

La Prueba U de Mann-Whitney
Se utiliza para saber si dos muestras
independientes provienen de poblaciones que
difieren en su ubicacin (tendencia central).
Es la contraparte de la prueba t para muestras
independientes. Prueba la hiptesis de que la mediana
de las dos poblaciones son iguales contra que no lo
son.

Si Ho es cierta, el promedio de los rangos para los dos


grupos muestrales debe ser aproximadamente igual.

La Prueba U de Mann-Whitney
Ordenacin
por rango

Smbolos

Ordenar por rangos todos los elementos que


deben probarse, en orden creciente

n1 = nmero de elementos de la muestra 1


n2 = nmero de elementos de la muestra 2
R1 = suma de los rangos de los elementos de
la muestra 1
R2 = suma de los rangos de los elementos de
la muestra 2
www.leondariobello.com
ldbello@leondariobello.com

La Prueba U de Mann-Whitney
Estadstico U

U = n1 n2 + n1 (n1 + 1)

R1

2
Una medida de la diferencia entre las observaciones
ordenadas por rangos de las dos muestras

Media del
Estadstico
Clculo del
error estndar

U = n1 n2
2

u = n1 n2 (n1 + n2 + 1)
12

www.leondariobello.com
ldbello@leondariobello.com

Prueba de Suma de Rangos:


La Prueba U de Mann-Whitney

Formulacin
de la hiptesis

Lmites de la
regin de
aceptacin

Ho: Me1 = Me2 Hiptesis nula, no hay


diferencia entre las dos poblaciones, por lo
cual tienen la misma mediana
H1: Me1 Me2 Hiptesis alternativa, hay una
diferencia entre las dos poblaciones, por lo
cual tienen medianas diferentes

= nivel de significancia
www.leondariobello.com
ldbello@leondariobello.com

Prueba de Suma de Rangos:


La Prueba U de Mann-Whitney
Eleccin de la
Distribucin

En caso de que algn n sea mayor de 20, se


puede aproximar con la distribucin normal.

Interpretacin
de resultados

Si el estadstico muestral U cae dentro de la


regin de aceptacin es valida la hiptesis nula
de que no hay diferencia y concluiremos que
las distribuciones son iguales

www.leondariobello.com
ldbello@leondariobello.com

La Prueba de Wilcoxon con signo


Una prueba que utiliza direccin y magnitud, propuesta
en 1945 por Frank Wilcoxon, se llama ahora
comnmente prueba de rango con signo de
Wilcoxon.
Esta prueba se aplica en el caso de una distribucin
continua simtrica.
Utiliza las magnitudes de las diferencias entre las
mediciones y un parmetro de ubicacin segn una
www.leondariobello.com
hiptesis, en lugar de los signos de las diferencias

ldbello@leondariobello.com

Suposiciones
La muestra es aleatoria
La variable es continua
La poblacin se distribuye simtricamente
alrededor de su media

La escala de medicin es al menos de


intervalo
www.leondariobello.com
ldbello@leondariobello.com

Hiptesis

a)

Ho: = o

b) Ho: o

b) Ho: o

Ha: o

Ha: < o

Ha: > o

Estas son las hiptesis que pueden probarse para


alguna media de poblacin no conocida o

Pasos para la prueba de Wilcoxon con


signo
1. Restar la media hipottica o de cada
observacin
Di = xi - o
Se elimina cualquier diferencia que de
cmo resultado cero.
Tener en cuenta que se reduce el tamao
de n.

2. Ordenar las diferencias de menor a


mayor sin importar el signo (slo el
valor absoluto).

Si dos o ms son iguales asignar a cada


valor la media de la posicin que ocupa
en la lista.

3. Asignar:
A las diferencias positivas se les asigna
como W+
A las diferencias negativas se les
asigna como W Sumar cada grupo
El menor valor de los dos anteriores se
asigna como W.

4. Comparar los valores obtenidos con los


valores crticos en la tabla (0.05, 0.025 y
0.01)

N es el nmero de diferencias halladas, sin


tomar en cuenta las que son iguales a
cero.

Ejemplo
En un experimento para medir la efectividad de
un medicamento para dormir, basndose en
las horas de sueo de los pacientes, un
siclogo seleccion aleatoriamente 10
pacientes a los cuales se les suministr el
medicamento y luego un placebo.

La siguiente tabla muestra las horas de sueo


de cada paciente con la sustancia
suministrada, as como las diferencias,
rangos y conclusin.

Horas de sueo

Paciente

Droga

Placebo

Diferencia

Rango
(Ignorando el signo)

6.1

5.2

0.9

3.5*

7.0

7.9

-0.9

3.5*

8.2

3.9

4.3

10

7.6

4.7

2.9

6.5

5.3

1.2

8.4

5.4

3.0

6.9

4.2

2.7

6.7

6.1

0.6

7.4

3.8

3.6

10

5.8

6.3

-0.5

W+ = 50.5

W- = 4.5

W = 4.5

Ho: la efectividad de la droga es mayor que la del


placebo
Ha: la efectividad de la droga es menor a la del
placebo.
* Los rangos 3ro y 4to han sido promediados
W+ = 50.5

W- = 4.5

W = 4.5

Como W = 4.5, con una significacin de 0.025 se


puede afirmar que el medicamento s es efectivo.

Valores crticos de T en la prueba de rangos sealados de los pares igualados de Wilcoxon


Nivel de significacin para prueba de una cola
N

.025

.01

.005

Nivel de significacin para prueba de dos colas

.05

.02

.01

---------

--------

--------

10

11

11

12

14

10

13

17

13

10

14

21

16

13

15

25

20

16

16

30

24

20

17

35

28

23

18

40

33

28

19

46

38

32

20

52

43

38

Utilizando Paquete Estadstico SPSS


Analizar Pruebas no paramtricas 2 muestras relacionadas
Rangos
Rango
promedio

N
horas de s ueo con
el placebo - horas de
sueo c on la droga

Rangos
negativ os
Rangos
pos itiv os
Empates
Total

0c
10

a. horas de sueo con el placebo < horas de sueo con la dr og a


b. horas de sueo con el placebo > horas de sueo con la dr og a
c. horas de sueo con el placebo = horas de sueo con la dr og a

Suma de
rangos

6.31

50.50

2.25

4.50

Utilizando Paquete Estadstico


SPSS
b
Estad sticos de contraste

horas de sueo con el placebo


- horas de sueo con la droga

Z
Asy mp. Sig. (2-t ailed)
a. Basado en los rangos positivos
b. Pr ueba de los r ang os con signo de Wilcoxon

-2.346 a
.019

Prueba de la Suma de Rangos


de Wilcoxon
Para comparar dos grupos
Equivalente no paramtrico de la prueba
T.
Consiste de 3 pasos bsicos

Paso 1
Asignar rangos ascendentemente para
cada grupo

Si se dan valores iguales promediar sus


rangos

Paso 2
Sume los rangos en el grupo con el tamao
de muestra ms pequeo.
Si los dos grupos tienen el mismo tamao,
se debe elegir uno.

W = suma de todos los rangos en el grupo


con el tamao de muestra ms pequeo.

Paso 3
Compare esta suma con el valor hallado en la
tabla de Wilcoxon.
Hallar la fila correspondiente al tamao del grupo
con la muestra ms pequea (n).
Si el valor de W es menor que el hallado en la
tabla, se rechaza la hiptesis nula, es decir, hay
diferencias significativas.
Ho: No existen diferencias significativas entre
medias
Ha: Existen diferencias significativas entre medias

Ejemplo
Se afirma que un estudiante universitario de ltimo ao
puede aumentar su calificacin en el rea del campo de
especialidad del examen de registro de graduados en al
menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmacin, se
dividen 20 estudiantes del ltimo ao en 10 pares de
modo que cada par tenga casi el mismo promedio de
puntos de calidad general en sus primeros aos en la
universidad. Los problemas y respuestas de muestra se
proporcionan al azar a un miembro de cada par una
semana antes del examen. Se registran las siguientes
calificaciones del examen:

Pruebe la hiptesis nula en el nivel de significancia de 0.05 de que los


problemas aumentan las calificaciones en 50 puntos contra la hiptesis
alternativa de que el aumento es menor a 50 puntos.
Par

Con problemas de
muestra

Sin problemas de
muestra

531

509

22

-28

621

540

81

31

663

688

-25

-75

579

502

77

27

3.5

451

424

27

-23

660

683

-23

-73

591

568

23

-27

3.5

719

748

-29

-79

10

543

530

13

-37

10

575

524

51

di

di d0

Rangos

En este caso d0 = 50, por lo que se procede


a calcular las diferencias entre las
muestras y luego restarles el valor de 50.
Para n=10 la tabla muestra que la regin
crtica es w+ 11.
w+

= 6 + 3.5 + 1 = 10.5

Decisin y Conclusin:
Como 10.5 es menor que 11 se rechaza
Ho y se concluye con un = 0.05 que
los problemas de muestra, en
promedio,
no
aumentan
las
calificaciones de registro de graduados
en 50 puntos.

La Prueba De WILCOXON Para Muestras


Grandes
Estadstico Z

Media del
Estadstico
Clculo del
error estndar

n(n 1)
W
4
n(n 1)(2n 1)
24

w = n(n+1)
4

u = n(n+1) (2n +1)


24

PRUEBA DE WILCOXON CON


MUESTRAS GRANDES
Se debe de realizar una aproximacion a la
normal, con la media y la desviacion tipica
definida por las siguientes expresiones:

= n(n + 1)
4
En la expresion anterior n es el tamao de
la muestra.

DESVIACION ESTANDAR

n(n 1)(2n 1)

24
A partir de las expresiones anteriores
deducimos la expresion para Z curva normal
tipificada para esta prueba y seria asi:

Valor tipificado

n(n 1)
W
4
n(n 1)(2n 1)
24

You might also like