Professional Documents
Culture Documents
INFERENCIA ESTADSTICA
Bibliografa bsica:
Berenson y Levine (1996) Estadstica para Administracin y Economa. 6. Ed.
Prentice Hall Hispanoamericana. Madrid.
Captulos: 9, 10 (Apartados 10.1, 10.2, 10.3, 10.4, 10.5, 10.6)
1.1.
ESTIMACIN
-1-
1.1.1.1.
Imparcialidad
Decimos que un estimador es imparcial o insesgado cuando su valor esperado
coincide con el parmetro poblacional que estima.
En el caso de la media muestral, esta propiedad se demuestra muy fcilmente con
unos pocos pasos algebraicos:
Partiendo de la frmula de clculo de la media muestral, estudiada en la materia
anterior de Estadstica:
n
x
i 1
-2-
n
xi
E ( x ) E i 1
n
n
E xi
E ( x ) i 1
n
Como la esperanza de una suma es igual a la suma de las esperanzas:
E ( x i )
E ( x ) i 1
n
Y como sabemos que la esperanza de la variable estudiada es :
E( x)
n.
n
Simplificando resulta:
E (x )
Eficiencia
Un estimador es eficiente si en promedio se acerca ms al parmetro estimado que
cualquier otro estimador.
La media muestral cumple este requisito para la media poblacional, ya que tiene la
mnima varianza entre los estimadores de la media poblacional.
Consistencia
Decimos que un estimador es consistente si a medida que se aumenta el tamao de la
muestra, el estimador se aproxima sistemticamente al valor del parmetro
poblacional.
-3-
Al aumentar el tamao de la muestra, cada vez, las diferencias entre la media muestral
y la media poblacional se van haciendo ms reducidas.
El cumplimiento de estas propiedades hace de la media muestral el mejor estimador
de la media poblacional.
x
n
X
N
2400
10000
-4-
x
n
P(1 P)
n
np 5
y
n(1 p) 5
Estas condiciones implican requerimientos de muestras de tamao considerables para
las estimaciones de proporciones.
-5-
N n
N 1
fcpf
x
n
N n
N 1
P(1 P) N n
n
N 1
El fcpf siempre ser menor que 1, lo cual implica que en este tipo de muestreo, las
estimaciones surgidas de este tipo de muestreo resultan ms exactas, o lo que es lo
mismo tienen menos dispersin en el muestreo.
Preguntas de reflexin:
-6-
1.1.1.2.
Media poblacional
Media muestral
Proporcin poblacional
Proporcin muestral
Varianza poblacional
Varianza muestral
x margen de error
-7-
Z
1
x
n
ese valor 1
95%
1,96
99%
2,575
90%
1,645
LI , LS x Z1
x
n
;x Z
-8-
Veamos un ejemplo:
Deseamos estimar la altura promedio de una poblacin de estudiantes varones
de esta Universidad.
Utilizaremos para ello una muestra aleatoria de 10 estudiantes. Los valores
obtenidos de la medicin de la altura son:
Caso
1
2
3
4
5
6
7
8
9
10
x
i 1
x 169,4 cm
Para obtener el intervalo de confianza suponemos que la variable aleatoria se
distribuye normal, y calculamos cada uno de los valores que indicamos.
Trabajaremos con un 1-=0,95.
-9-
1,96
x 4
n 10
Por lo tanto, el intervalo que surge ser:
LI , LS 166,920; 171,879
Como puede analizarse a partir del ejemplo, el intervalo que surge depende de la
muestra que ha sido seleccionada, en el caso de haber elegido a otros estudiantes y
no a esos, el resultado de la media muestra podra haber sido distinto, y en
consecuencias tambin el intervalo obtenido.
- 10 -
- 11 -
Fuente:
Elaboracin
propia
en
base
a
herramienta
de
simulacin
provista
por:
http://www.geogebra.org/en/upload/files/Juan%20de%20Jesus%20Sandoval/la_distribucion_normal_t_student.html
- 12 -
- 13 -
- 14 -
- 15 -
- 16 -
Los intervalos as obtenidos son, no podra ser de otra manera, ms grandes y menos
precisos que los que se obtendran si conocemos la varianza en una distribucin
normal.
Si la variable aleatoria X es normal, el estadstico:
x
s
n
Se distribuye t con n-1 grados de libertad.
Grados de libertad
La idea de grados de libertad remite a la cantidad de valores de una muestra que
podran asumir cualquier valor. Si nosotros conocemos o calculamos en funcin de
tales datos un estadstico, podemos perder grados de libertad o valores que pueden
variar, del total de datos disponibles de la muestra. El Diccionario de metodologa
estadstica (Gonzalo Gonzalvo Maynar, 1978, Morata Ed., Madrid) indica que cuando
un estadstico se usa en la estimacin de un parmetro poblacional, los grados de
libertad dependen de las restricciones impuestas sobre las observaciones: cada
restriccin hace perder un grado de libertad.
Estimacin del intervalo de confianza
El intervalo de confianza para la media se construir segn el siguiente esquema:
Nivel de confianza: (1-)%
Lmites del intervalo:
Inferior:
x t
1 ;n 1
2
Superior:
x t
1 ;n 1
2
- 17 -
Veamos un ejemplo:
Repitamos el ejercicio vinculado con la altura promedio de una poblacin de
estudiantes varones de esta Universidad, pero ahora suponiendo que no
conocemos la varianza poblacional.
Supongamos que estimamos con los datos de la muestra la varianza muestral,
s2 = 16,16 cm2.
Trabajaremos con un 1-=0,95.
x 169,4 cm
29;1
2,0452
s 4,02
n 10
Por lo tanto, el intervalo que surge ser:
LI , LS 166,8; 171,99
La conclusin en este caso ser: Con un nivel de confianza del 95%, la altura
promedio de los varones de la poblacin de estudiantes de la Universidad es
atrapada por el intervalo [166,8 cm; 171,99 cm].
Si comparamos el resultado con el caso de varianza conocida (a pesar de la
pequea diferencia de varianzas implicadas), el intervalo que surge de
considerar que no conocemos la varianza implica un intervalo ms amplio
(menos preciso), lo cual est asociado con un mayor margen de seguridad
debido a que no conocemos el verdadero valor de la varianza.
- 18 -
LI , LS p Z1
p(1 p)
;pZ
1
n
2
p(1 p)
Donde:
p proporcin muestral
P proporcin poblaciona l
n tamao de la muestra
Z valor crtico de la distribuci n normal
- 19 -
178
400
p 0,445
p
LI , LS p Z1
p(1 p)
;pZ
1
n
2
p(1 p)
2,576
LI , LS 0,445 2,576
0,445(1 0,445)
0,445(1 0,445)
;0,445 2,576
400
400
LI , LS 0,38;0,51
Como conclusin, podemos decir que con un nivel de confianza del 99%, el intervalo
[0,38; 0,51] atrapa el verdadero valor poblacional de la proporcin de votantes que
tienen decidido votar al candidato.
Observe que, dependiendo de los porcentajes de otros candidatos, esto podra
significar que pierda la eleccin (si obtiene un porcentaje inferior al 50% de los votos,
algn otro candidato puede alcanzar un porcentaje mayoritario) o bien que gane (si
obtiene un valor mayor al 50% de los votos), en ambos casos, con el nivel de
confianza definido que, siendo tan elevado, le permite estar casi seguro de que el
resultado se encuentra en el intervalo estimado.
- 20 -
- 21 -
Analicemos un ejemplo:
Analizamos la supervivencia adulta en una pequea poblacin rural. Uno de los datos
que analizamos es el nmero de hermanos tenidos en promedio.
Consideremos la siguiente tabla que indica el nmero de hermanos tenidos por todos
los residentes.
- 22 -
Nmero de
hermanos
Caso
Nmero de hermanos
26
27
28
29
30
31
32
33
34
10
35
11
36
12
37
13
38
14
39
15
40
16
41
17
42
18
43
19
44
20
45
21
46
22
47
23
48
24
49
25
50
- 23 -
Tamao 3
Muestra
Casos seleccionados
24
14
37
49
11
41
48
21
50
30
10
40
48
26
34
11
17
47
40
10
31
47
11
Tamao 5
Muestra
Casos seleccionados
45
21
14
15
33
41
33
16
38
34
49
22
35
17
49
30
17
15
39
21
35
28
11
26
40
24
45
42
31
23
19
19
38
46
50
37
33
31
48
10
34
46
33
46
37
- 24 -
Tamao 7
Muestra
Casos seleccionados
40
41
20
14
17
32
30
50
23
45
21
13
37
30
13
22
17
35
10
25
19
28
17
14
42
28
31
41
27
36
10
14
20
38
36
18
38
48
18
48
35
46
17
23
39
14
33
19
48
10
13
49
20
27
48
34
Muestra
Tamao 3
Valores de los casos de la
muestra seleccionada
Media muestral
4,33
5,67
2,67
4,67
3,33
4,33
10
4,33
- 25 -
Muestra
Tamao 5
Valores de los casos de la muestra
seleccionada
Media muestral
4 4 7 6 2
4,6
3 5 6 1 9
4,8
5 8 4 2 4
4,6
8 3 4 2 6
4,6
4 7 2 4 6
4,6
5 4 3 2 4
3,6
4 2 1 5 4
3,2
4 9 5 3 6
5,6
5 3 1 6 3
3,6
10
5 5 3 5 5
4,6
Muestra
Tamao 7
Valores de los casos de la muestra seleccionada
Media muestral
4,43
4,86
3,57
4,28
4,43
3,71
4 4
6,71
4,14
3,86
10
4,14
- 26 -
- 27 -
- 28 -