You are on page 1of 302

DEPARTAMENTO DE CIENCIAS EXACTAS

TEXTO DE
ESTADÍSTICA II
PARA
CIENCIAS EMPRESARIALES

Autores:

Ing. Mgr. Carlos Valdivieso T.


Jefe de Ciencias Exactas UPB

Lic. Roberto Valdivieso C.


Docente UPB

Ing. Oscar Valdivieso T.


Docente UPB

Cochabamba – Bolivia
Año 2003
ANEXO DE

TABLAS ESTADÍSTICAS

Tabla I: Distribución Binomial Acumulada

Tabla II: Distribución de Poisson Acumulada

Tabla III: Distribución Normal Estándar Acumulada

Tabla IV: Distribución Normal Estándar de Cola Superior

Tabla V: Números Aleatorios

Tabla VI: Distribución t de Student

Tabla VII: Distribución Chi-Cuadrada

Tabla VIII: Distribución F de Fisher

Tabla IX: Valores Críticos de U en la Prueba de Mann-Whitney


ANEXOS

1. Distribuciones de Densidad

2. Trabajo de Aplicación Final


PRÓLOGO

Este texto ha sido escrito por la necesidad de contar con un texto práctico, que ayude a
los estudiantes a entender de manera clara los conceptos, procedimientos, cálculos,
objetivos y finalidad de la Estadística Inferencial, en cualquier área de preparación en la
que se encuentren.

Su cualidad es presentar una estructura adecuada para abordar esta parte de la


Estadística, de manera que las distintas partes que la integran se complementen,
conforme se avanza en su estudio capítulo por capítulo, de manera precisa y lógica, con
el objeto que el estudiante forme un esquema mental que le ayude a aprehender con
mayor facilidad.

Además, su estructura y función permiten al profesor o docente encargado de enseñarla,


hacer un seguimiento total de cada uno de los temas en particular, por las facilidades
didácticas que presenta cada uno de sus capítulos, lo que facilita al docente construir un
esquema que le permita fluidez en la transmisión de conocimientos hacia los alumnos.

Los árboles de decisiones que se incluyen en cada tema, con el objeto que la resolución
de problemas inferenciales se practique de manera sencilla, son aportes exclusivos de los
autores. Por otro lado, en cada capítulo se han incluido ejercicios de clase, con el fin de
que el docente pueda usarlos para realizar su explicación de manera efectiva, y también
ejercicios propuestos, para que el estudiante pueda resolverlos en casa, en base a la
enseñanza que recibió en el aula.

En consecuencia, consideramos que el texto será un auxiliar de gran ayuda al encargado


de impartir esta materia, por la capacidad sencilla y escalonada de abordar la Estadística
Inferencial y la práctica de resolver sus problemas. Los planteamientos teórico-prácticos
son realizados paso por paso, presentando ejemplos ilustrativos y fáciles de comprender.

El capítulo 1 introduce al estudiante a las nociones de la inferencia estadística,


respondiendo a la pregunta: ¿Cómo se organiza y presenta la información recopilada
mediante un experimento aleatorio? El proceso a seguir es: a través de la determinación
del espacio muestral, eventos de interés, asignación de probabilidades y formulación de la
variable aleatoria, se define la distribución de probabilidades. Luego sigue la pregunta:
¿Cómo se puede resumir la información presentada en distribuciones de probabilidad?
Mediante estadígrafos de Tendencia Central (que fijan la posición de la distribución).
¿Cómo se puede caracterizar una distribución? A través de estadígrafos de Tendencia
Central y Dispersión (que define la forma de la distribución). Conformada la comprensión
de las distribuciones de probabilidades, se desarrolla la Estadística Inferencial de dos
variables, por su importancia para generar la imaginación de formular hipótesis y
desarrollar la habilidad de cruzar la información elaborada, como respuesta a los objetivos
de cualquier tipo de investigación en el proceso de construir el conocimiento. Se incluyen
reglas para el cálculo de probabilidades, arboligramas y distribuciones bidimensionales de
probabilidades.

Una vez que se ha comprendido el concepto de distribución de probabilidades, el capítulo


2 da al lector la manera de formular, ajustar y/o reconocer para una situación empírica,
modelos teóricos de distribuciones de probabilidad, tanto discretos como continuos.
En el capítulo 3 se exponen los conceptos fundamentales de los métodos de muestreo y
el uso de las distribuciones de muestreo en la inferencia estadística, aplicando el teorema
central del límite.

Puesto el fundamento de Probabilidades y Distribuciones Muestrales, los capítulos 4 y 5


se dedican a mostrar con detalle los procedimientos para la exploración estadística a
través de la Estimación y para establecer supuestos a través de las Pruebas de Hipótesis,
todo esto en el mercado de la Estadística Inferencial Paramétrica.

El capítulo 6 desarrolla la prueba del Análisis de Varianza, más conocida como ANOVA,
con el objeto de introducir al lector en el análisis de experimentos.

Una vez comprendida la Estadística Paramétrica, el capítulo 7 presenta las más


importantes pruebas de hipótesis no Paramétricas, muy usadas en el campo de la
Ingeniería y Ciencias Empresariales, en la experimentación científica y la simulación.

El texto que se ofrece nace como fruto de una larga experiencia en la labor docente
universitaria, ejercitada en medio de diversos ambientes estudiantiles, unas veces en
Economía, Administración, Mercadotecnia, Sociología y Comunicación, otras veces en
Ingeniería Industrial, Civil, Producción, Química y Biología, y otras tantas en Derecho,
Psicología y Pedagogía, en los cuales los autores han tenido la oportunidad de ofrecer el
conocimiento sobre la Estadística existente en muchos libros, el elaborado por su propia
experiencia, su personalidad didáctica y el aporte estudiantil, con excelentes resultados
para los formados.

Esperamos que el texto de Estadística II que presentamos pueda ser de gran ayuda a los
estudiosos que tengan interés de usar esta rama científica para el beneficio de su entorno
profesional.

Los autores
CONTENIDO

PRÓLOGO i

CONTENIDO iii

PARTE I: CONCEPTOS FUNDAMENTALES SOBRE PROBABILIDAD 1

CAPÍTULO 1. DISTRIBUCIÓN DE PROBABILIDADES 2

1. Introducción 2
2. Experimento Determinístico y Aleatorio 2
3. Características de un Experimento Aleatorio 2
4. Probabilidad 6
5. Variable Aleatoria 8
6. Distribución de Probabilidades 9
7. Estadígrafos de Posición y Dispersión Esperados 13
8. Reglas de Composición para el Cálculo de Probabilidades 22
9. Cálculo de Probabilidades Utilizando Diagrama de Árbol 29
10. Generalización de las reglas para el cálculo de probabilidades 33
11. Distribución Bidimensional de Probabilidades 35
Ejercicios de Clase 39
Ejercicios Propuestos 44
Ejercicios para Examen 48

CAPÍTULO 2. DISTRIBUCIONES TEÓRICAS DE PROBABILIDAD 49

1. Introducción 49
2. Distribuciones Teóricas Discretas de Probabilidad 50
3. Distribuciones Teóricas Continuas de Probabilidad 58
4. Aproximación Normal a la Binomial 63
5. Árbol de Decisión para Elegir la Distribución Teórica Adecuada en la
Resolución de Problemas 65
Ejercicios de Clase 67
Ejercicios Propuestos 70
Ejercicios Para Examen 75

PARTE II: MUESTREO 77

CAPÍTULO 3. MÉTODOS Y DISTRIBUCIONES DE MUESTREO 78

1. Introducción 78
2. Tipos de Muestreo 79
3. Métodos de Muestreo Aleatorio 80
4. Distribuciones de Muestreo 83
5. Teorema Central del Límite 89
iii
6. Tamaño de la Muestra y Error Estándar 90
7. Multiplicador de Población Finita 91
8. Árbol de Decisión para las Aplicaciones de la Distribución Normal 92
9. Errores Sistemáticos en el Muestreo 94
10. Elementos de Importancia en las Encuestas Muestrales 95
Ejercicios de Clase 96
Ejercicios Propuestos 97
Ejercicios para Examen 98

PARTE III: INFERENCIA ESTADÍSTICA 101

CAPÍTULO 4. ESTIMACIÓN ESTADÍSTICA 103

1. Introducción 103
2. Tipos de Estimaciones 103
3. Criterios de un Buen Estimador 104
4. Estimación por Intervalos 104
5. Árbol de Decisión para la elección del Intervalo de Confianza Adecuado
en la Resolución de Problemas 133
Ejercicios de Clase 135
Ejercicios Propuestos 139
Ejercicios para Examen 144

CAPÍTULO 5. PRUEBAS DE HIPÓTESIS 147

1. Introducción 147
2. Conceptos Básicos del Procedimiento de la Prueba de Hipótesis 147
3. Prueba de Significación de Una y Dos Colas 149
4. Pruebas de Hipótesis 149
5. Árbol de Decisión para la Elección de la Prueba de Hipótesis Adecuada
en la Resolución de Problemas 165
Ejercicios de Clase 167
Ejercicios Propuestos 171
Ejercicios para Examen 177

CAPÍTULO 6. ANÁLISIS DE VARIANZA 180

1. Introducción 180
2. Suposiciones 180
3. Procedimiento 180
4. ANOVA con un Factor 181
5. ANOVA con dos Factores sin Interacción 185
Ejercicios de Clase 190
Ejercicios Propuestos 191
Ejercicios para Examen 193

iv
CAPÍTULO 7. MÉTODOS NO PARAMÉTRICOS 195

1. Introducción 195
2. Pruebas No Paramétricas 195
3. Ventajas y Desventajas de los Métodos No Paramétricos 195
4. Pruebas Chi-Cuadrada 196
5. Prueba del Signo para Datos Pareados 202
6. Pruebas de Suma de Rangos 207
7. Árbol de Decisión para Elegir la Prueba Paramétrica o No Paramétrica en
la Resolución de Problemas 214
Ejercicios de Clase 216
Ejercicios Propuestos 220
Ejercicios para Examen 226

BIBLIOGRAFÍA 229

ANEXOS 231

1. Distribuciones de Densidad 231


2. Trabajo de Aplicación Final 236

ANEXOS DE TABLAS ESTADÍSTICAS 250

I. Distribución Binomial Acumulada 250


II. Distribución de Poisson Acumulada 257
III. Distribución Normal Estándar Acumulada 262
IV. Distribución Normal Estándar de Cola Superior 263
V. Números Aleatorios 264
VI. Distribución t de Student 265
VII. Distribución Chi-Cuadrada 266
VIIII. Distribución de Fisher 267
IX. Valores Críticos de U en la Prueba de Mann-Whitney 272

v
PARTE I

CONCEPTOS FUNDAMENTALES SOBRE PROBABILIDAD

CONCEPTO

Una probabilidad es un grado de certeza que se puede obtener de cualquier evento que
vaya a ocurrir o que ocurrió, en base a una escala de 0 a 1. Si el evento nunca ocurrirá, se
le asigna una probabilidad de 0, caso contrario, si el evento siempre pasará, se le asigna la
probabilidad de 1. Dependiendo si es menos o más probable que el suceso se dé, se
tendrán probabilidades de 0 a 0.5 o de 0.5 a 1, respectivamente.

DETERMINACIÓN

La probabilidad puede ser hallada cuantitativamente de manera histórica, mediante la


frecuencia relativa de la repetición del suceso en análisis, o si nunca se dio anteriormente o
no se tienen los datos, mediante la división de los casos favorables a que ocurra el evento
sobre el número de casos posibles. Sin embargo, existen sucesos en los que por su
naturaleza no se puede saber su probabilidad exacta o asignarle un valor específico, por lo
cual se procede a realizar un criterio subjetivo o cualitativo, en base a la experiencia, sobre
su posibilidad de ocurrencia.

APLICACIÓN

El análisis de probabilidades surgió como una manera para predecir los triunfos o derrotas
en los juegos de azar. Posteriormente se aplicó en el campo de los seguros de vida. Por su
utilidad y versatilidad en ese campo, todas las ramas científicas la adoptaron a sus
respectivas necesidades. Es así que las ingenierías la utilizaron para el control de calidad,
diseño y análisis de experimentos, pronósticos en la producción y la dirección de
operaciones, optimización multivariable, modelación y para decisiones diversas. Las
Ciencias Económicas utilizaron la estadística como una metodología de investigación, en el
análisis econométrico, investigación de mercados y decisiones gerenciales diversas.

1
CAPÍTULO 1

DISTRIBUCIÓN DE PROBABILIDADES

1. INTRODUCCIÓN

La teoría de las probabilidades tuvo su origen en los problemas relacionados con los juegos
de azar (dados, barajas, etc.). Mas tarde el concepto de probabilidad, convenientemente
modificado, se ha aplicado a los seguros y a los problemas de inferencia estadística. Estos
últimos poseen numerosas aplicaciones en la física moderna, la biología, la agricultura, la
industria, las ciencias sociales y la economía. De aquí que la teoría de las probabilidades
tenga hoy gran interés práctico y teórico y constituya una rama importante de la matemática,
ingeniería y de las ciencias sociales.

2. CLASES DE EXPERIMENTOS: DETERMINÍSTICO Y ALEATORIO

Un experimento es determinístico cuando, conocidas las condiciones en que se produce, los


resultados que se obtienen están sujetos a dichas condiciones. En general, este tipo de
conclusiones corresponden al campo de la física y química. Por ejemplo: Combinando una
molécula de oxígeno (O) con dos de hidrógeno (2H), se obtiene la molécula de agua (H2O)
indefectiblemente, si se usa como catalizador una chispa eléctrica.

Los datos para una variable pueden obtenerse no solo por un experimento determinístico,
sino también mediante experimentos aleatorios. Un experimento aleatorio se define como
aquél que se puede producir de manera indefinida, con las mismas condiciones, sin la
posibilidad de determinar de antemano el resultado de una prueba, en observación a dichas
condiciones. Ejemplo: fabricación de un bien estándar o defectuoso, lanzar una moneda o un
dado, observar un nacimiento y ver el sexo, determinar el día en que una máquina va a fallar,
etc. En todos estos ejemplos no se puede saber el resultado preciso antes de realizar los
experimentos.

3. EXPERIMENTO ALEATORIO

3.1. Características

Un experimento aleatorio, tiene las siguientes características.

• Se puede repetir de manera indefinida, esto asegura que los resultados sean simétricos y
que el elemento del experimento sea homogéneo.
• Los resultados del experimento son numerables y registrables.
• No es posible determinar el resultado exacto de un experimento aleatorio antes de que
ocurra, pero si obtener una lista de los posibles.
• Por el principio de la regularidad estadística es posible estimar un resultado cualquiera del
experimento cuando este se haya realizado muchas veces.

2
3.2. Espacio muestral

Es el conjunto de resultados posibles o imaginables de un experimento aleatorio. Por


ejemplo, lanzar un dado genera el siguiente espacio muestral:

S = S (1, 2, 3, 4, 5, 6) Por extensión


S = S (x ∈ N / 1 ≤ N ≤ 6) Por comprensión

Los espacios muestrales pueden ser finitos o infinitos. Es finito cuando se trata de un
conjunto numerable, como por ejemplo los resultados posibles que existen al elegir un
número de la lotería de entre 100000 boletos. Es infinito cuando es continuo no numerable,
como por ejemplo los resultados posibles que se pueden dar al elegir una persona de todas
las que hay en el mundo.

3.3. Determinación del espacio muestral

Dado un experimento aleatorio, los resultados posibles o imaginables a que da lugar dicho
experimento pueden determinarse utilizando:

• El arboligrama (que es el método más versátil),


• un cuadro de doble entrada (sólo aplicable en el caso de dos intentos o ensayos),
• aplicando números combinatorios, permutaciones o variaciones (que tan solo entregan el
número de posibles resultados), según el caso del experimento.

Cualquiera de los instrumentos señalados son alternativos, con las restricciones descritas.

Ejemplo.

Experimento aleatorio con reposición o reemplazo.

En el bolsillo de un estudiante hay billetes de 10, 20 y 50 bolivianos. Si se obtienen dos


billetes, uno tras otro, elegidos al azar, con reposición. ¿Qué resultados pueden obtenerse?

Se pretende determinar el espacio muestral.

Resolución.

• Se trata de un experimento aleatorio, porque es posible efectuar la extracción de dos


billetes, uno tras otro elegidos al azar, de manera permanente y bajo las mismas
condiciones, observar los resultados y registrarlos.

• Los resultados posibles o imaginables de dicho experimento pueden ser obtenidos


mediante un arboligrama.

Para construirlo se debe preguntar: ¿cuáles son los posibles billetes que se puede sacar en
la primera extracción? La segunda pregunta: habiendo sacado un billete de 10, 20 o 50,
¿qué posibles billetes puedo sacar en la segunda extracción?

3
1a extracción 2a extracción

10
10 20
50

10 10
20 20 20
50 50

10
50 20
50

S = { 10-10 ; 10-20 ; 10-50 ; 20-10 ; 20-20 ; 20-50 ; 50-10 ; 50-20 ; 50-50 }

Una segunda forma de obtener el espacio muestral, es empleando un cuadro de doble


entrada de la siguiente forma:

En las columnas se registran los resultados de la primera extracción y en las filas, los de la
segunda extracción. El cuerpo de dicha tabla registra los resultados posibles o imaginables,
es decir el espacio muestral:

1a 10 20 50
a
2
10 10 – 10 10 – 20 10 – 50
20 20 – 10 20 - 20 20 – 50
50 50 - 10 50 - 20 50 - 50

Ejemplo.

Experimento aleatorio sin reposición o reemplazo.

En el bolsillo de un estudiante hay billetes de 10, 20 y 50 bolivianos. Si se obtienen dos


billetes, uno tras otro, elegidos al azar, sin reposición. ¿Qué resultados pueden obtenerse?

Hallar el espacio muestral.

Resolución.

• No se trata del mismo experimento aleatorio, porque en este caso se extraen los billetes
uno tras otro, pero sin reposición.
• Los resultados posibles o imaginables de dicho experimento pueden ser obtenidos
mediante un arboligrama.

Aquí se realizan las mismas preguntas que en ejemplo anterior. Se observará que basta que
una condición del experimento cambie, para que éste tenga otro espacio muestral.

4
1a extracción 2a extracción

20
10
50

10 10
20 20
50 50

10
50
20

S = { 10-20 ; 10-50 ; 20-10 ; 20-50 ; 50-10 ; 50-20 }

También se puede usar un cuadro de doble entrada de la siguiente forma:

1a 10 20 50
a
2
10 X 10 – 20 10 – 50
20 20 – 10 X 20 – 50
50 50 - 10 50 - 20 X

Para ello se han omitido los resultados de la diagonal principal de la tabla.

3.4. Eventos o sucesos aleatorios

Un evento es un subconjunto del espacio muestral.

Ejemplo: Si el experimento aleatorio consiste en lanzar al aire una moneda tres veces y
observar los resultados conjuntos, un evento puede ser:

E1 = obtener tres caras en 3 lanzamientos.


E1 = E (c c c)

Un evento es un resultado o varios resultados de un espacio muestral en los que se está


interesado, con el propósito de estudiarlos o analizar los resultados.

3.5. Clases de eventos

a) Sucesos simples y compuestos

Los eventos o sucesos aleatorios pueden ser simples o compuestos, según puedan o no
descomponerse en otros resultados del experimento. Ejemplo: al lanzar una moneda sale
cara o cruz, estos resultados son simples. Al lanzar una moneda 2 veces: cs, cc o ss, son
eventos compuestos.
5
b) Sucesos ciertos e imposibles

Un suceso es cierto cuando los resultados que se obtienen cumplen las condiciones del
experimento. Ejemplo: al lanzar una moneda, los sucesos ciertos son cara o cruz. El suceso
imposible se da cuando el resultado del experimento no cumple las condiciones esperadas.
Ejemplo: cuando la moneda cae de perfil.

c) Sucesos mutuamente excluyentes o no.

Dos o más sucesos son mutuamente excluyentes cuando la ocurrencia de uno de ellos
excluye la aparición de los otros. Ejemplo: al lanzar un dado la aparición de 5 excluye la
aparición de 1, 2, 3, 4 y 6.

d) Sucesos igualmente posibles o no.

Dos o más eventos son igualmente posibles cuando ninguno tiene mayor posibilidad de
ocurrencia que el otro. Ejemplo: al lanzar una moneda hay la misma posibilidad que salga
cara o sello si ésta está bien hecha. Las monedas “cargadas” dan la posibilidad a sucesos
que no son igualmente posibles.

e) Sucesos dependientes e independientes

Un suceso es dependiente de otro cuando la ocurrencia de uno afecta al resultado del otro.
Ejemplo: si se tiene 3 bolas rojas y una azul en una urna y en la primera extracción se eligió
al azar una bola roja, el suceso que se extraiga una bola roja en la segunda extracción es
dependiente de la primera. Sin embargo, si la bola roja extraída se repone a la urna, la
segunda extracción será independiente de la primera.

4. PROBABILIDAD

La probabilidad es una medida del riesgo o de la incertidumbre. Se dice que existe riesgo
cuando se conoce el espacio muestral y la probabilidad de aparición de los sucesos. La
situación que indica incertidumbre, desconoce la presencia del espacio muestral, la
probabilidad de los sucesos o ambos.

La probabilidades pueden clasificarse en tres tipos:

4.1. Probabilidad a priori

La probabilidad de un suceso simple A, es el número que se determina mediante el cociente


de los casos favorables de la ocurrencia del evento y el número de casos posibles.

n (A ) Número de casos favorables al evento A


P (A ) = =
n Número de casos posibles

Algunas propiedades que presentan los sucesos, al hablar de sus probabilidades son:

• La suma de probabilidades de dos sucesos independientes es: P (A U B) = P(A) + P(B)


• La suma de probabilidades de dos eventos mutuamente excluyentes es: P(A’) = 1 - P(A)
6
• La probabilidad de cualquier evento presenta los siguientes valores: 0 ≤ P(A) ≤ 1
• Cada resultado debe ser igualmente posible.
• Se puede determinar la probabilidad de antemano.

Ejemplo.

Supongamos 3 nacimientos. ¿Cuál es la probabilidad de que hayan 2 varones nacidos?

Resolución.

• Determinar el sexo del recién nacido, es un experimento aleatorio porque el experimento


se puede repetir de la misma manera y bajo las mismas condiciones y no es posible saber
el resultado antes de realizarlo.
• Los resultados del experimento cuando se observa el nacimiento uno tras otro, en la
determinación del sexo son:
1
1
2 H
2 H
1
2
M
1 H
2 1 H
1
2
M 2
1
2 M
1
1
2 H
1
2
2 H
1 M
M 1
2
2 H
1
2
M
1
2
M

S=S (HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM)

• Calcular la probabilidad del evento E1 de que haya exactamente 2 nacidos hombres.

P(E1) = P(HHM, HMH, MHH) = P (HHM) + P (MHH) + P (HMH)

Para el análisis de dichas probabilidades es necesario recurrir a eventos simples.

 1  1  1  1
P(HHM) = P(H)P(H)P(M) =     =
 2  2  2  8

1 1 1 3
P(E1 ) = + + =
8 8 8 8

La probabilidad de 2 nacidos hombres es de 3 veces en 8 nacimientos, o del 37.5%.

Nota: Un problema de probabilidad sin todos estos pasos, no sirve.

7
4.2. Probabilidad a posteriori

• Es la frecuencia relativa observada de un evento durante un gran número de intentos.


• La fracción de veces que un evento se presenta cuando las condiciones son estables.
• Falla cuando los datos son insuficientes.

Ejemplo.

Según datos históricos se sabe que 20 de 100 taxis sufren choques muy fuertes al año en
Cochabamba ¿Cuál es la probabilidad de que se suba a un taxi y se choque?

Esta es una probabilidad a posteriori, y se la calcula, mediante la frecuencia relativa:

20
P(A) = *100 = 20%
100

Existe una probabilidad del 20% de que el taxi al que se subió sufra un choque fuerte.

4.3. Probabilidad subjetiva

• Está basada en las creencias de las personas que efectúan la estimación.


• Es la probabilidad asignada a un evento por un individuo, basada en la evidencia
disponible.
• Útil cuando los eventos se presentan una vez o pocas veces.

Ejemplo.

Un estudiante no realizó ningún esfuerzo en su preparación para rendir su examen de


estadística. No fotocopió el texto de la materia, no hizo las prácticas, no estudió los ejercicios
resueltos, y no atendió al docente en las clases dirigidas. Por lo tanto, tiene muy pocas
probabilidades de pasar el examen.

5. VARIABLE ALEATORIA

Es una función que permite transformar puntos del espacio muestral en puntos del conjunto
de los números naturales. Puede ser continua o discreta.

Ejemplo.

Supóngase el espacio muestral del sexo de 3 recién nacidos.

S=S(HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM)

Corresponde a la situación de observar 3 nacimientos uno tras otro.

Si interesa el número de hombres recién nacidos se puede observar la siguiente relación


entre la variable definida y el espacio muestral.

8
Casos del espacio Valores de la variable aleatoria discreta: (Xi).
muestral
MMM X1 = 0 => Los recién nacidos son todos mujeres
MMH, MHM, HMM X2 = 1 Significa 1 hombre entre los recién nacidos
MHH, HMH, HHM X3 = 2 Significa 2 hombres
HHH X4 = 3 Significa 3 hombres

Si dentro el espacio muestral, teniendo en cuenta la variable aleatoria definida, se define una
función de probabilidades que determine la ocurrencia de los diferentes valores de la
variable, se dice que se ha definido en: P(x en A)

6. DISTRIBUCIÓN DE PROBABILIDADES

Sea un experimento aleatorio que permite definir un espacio muestral, sea x la variable
aleatoria y P(x) las probabilidades respectivas. La función de probabilidad se obtiene cuando
determinada una variable aleatoria para el espacio muestral se dispone de las probabilidades
correspondientes producidas en el experimento aleatorio.

En el ejemplo anterior, la distribución de probabilidades es la siguiente:

Variable Casos del espacio P(xi)


xi muestral
x1 = 0 MMM 1/8
x2 = 1 MMH, MHM, HMM 3/8
x3 = 2 MHH, HMH, HHM 3/8
x4 = 3 HHH 1/8

que corresponde a una distribución de probabilidad para variable aleatoria discreta.

6.1. Función de cuantía

a) Propiedades.

La distribución de probabilidades, cuando la variable es discreta, se denomina función de


cuantía y debe cumplir con:

• Cualquier P(x) debe ser un número real.


• La suma de las distintas probabilidades de los valores de la variable debe ser 1:
n

∑ P(x ) = 1
x =1
i

• En consecuencia, cualquier P(x) debe estar entre 0 ≤ P(x) ≤ 1 para x = 0, 1, 2, ..., n.

Para determinar si una función es de cuantía debe cumplir con las condiciones anteriores.
Para evaluar la segunda condición: “La suma de la función de cuantía en el recorrido de la
variable debe sumar la unidad”, es necesario incorporar una variable de trabajo “k”, tal que:
• Si k = 1, entonces la función propuesta es de cuantía.
• Si k ≠ 1, entonces debe corregirse la función de cuantía en dicha constante.

9
Ejemplo.

Sea la siguiente función de cuantía: f(x) = 2x + 1 Para x = 0, 1, 2, 3.

a) Determine si es o no una función de cuantía, si no fuera, entonces corríjala.


b) Halle la probabilidad de que x sea menor que 2.
c) Halle la función de distribución y verifique el resultado anterior.

Resolución.

• Se verifica que la función propuesta admite solo valores reales.

• Debe cumplir la condición: “La suma de la función de cuantía en el recorrido de la variable


debe sumar la unidad". Para verificar esta propiedad se usa una variable constante "k”:

1 = k ∑ (2x+1) = k + 3k + 5k + 7k
1 = 16 k k = 1/16

La función propuesta no es de cuantía porque no cumple la segunda propiedad. Por lo tanto


debe modificarse.
2x + 1
a) Entonces la nueva función es: P(x) = para x = 0, 1, 2, 3.
16

b) Se pide P(x<2) = P(x=0) + P(x=1) = 1/16 + 3/16 = 4/16 = 1/4 (25%)

Respuesta: Que la variable x tome un valor menor que dos, ocurre en un 25%.

c) Se halla la función de distribución y se verifica

3 3
1
Se sabe que: P (x ) = Σ P (x i ) = Σ (2x + 1 )
i= 0 i =0 16

Expresando en forma de una distribución de probabilidades, donde:


1
1 4
P (x < 2 ) = ∑ * (2x + 1 ) =
x = 0 16 16

xi P(xi) Pac(xi)
0 1/16 1/16
1 3/16 4/16
2 5/16 9/16
3 7/16 16/16
16/16

b) Representación gráfica.

Las distribuciones de probabilidad para variable aleatoria discreta pueden ser representadas
mediante un diagrama de barras, circular o rectangular, usando los valores de probabilidad
para el eje y y los valores de la variable para el eje x. También pueden ser representadas
10
mediante diagramas acumulados de probabilidades.

Diagrama de barras.

DIAGRAMA DE BARRAS PARA LA FUNCIÓN DE CUANTÍA


1
P(x) = (2x + 1) para x = 0, 1, 2, 3.
16

45%

40%

35%

30%
P(xi) [%]

25%

20%

15%

10%

5%
0%
0 1 2 3
xi

6.2. Función de densidad

a) Propiedades.

La distribución de probabilidades de una variable aleatoria continua, se denomina función de


densidad y debe cumplir con:

• f(x) ≥ 0 para -∞ < x < ∞


• La integral de la función en el recorrido de la variable debe ser igual a 1.

∫ f ( x )dx = 1
−∞

La evaluación de una función de densidad se efectúa determinando el cumplimiento de las


condiciones anteriores. La segunda condición requiere incorporar la variable de trabajo “k”.

Se consideran las condiciones introducidas para el valor de k, a fin de determinar si la


función propuesta es de cuantía.

Ejemplo.

Sea la siguiente función de densidad:

f(x) = 2x + 1 Para 0 ≤ x ≤ 3
11
a) Determine si es o no una función de densidad, si no fuera, entonces corríjala.
b) Halle la probabilidad de que x sea menor que 2.
c) Halle la función de distribución y verifique el resultado anterior.

Se procede de la siguiente manera:

• Verificar si la función propuesta admite solo valores reales.

• Debe cumplir la condición: “La integral de la función en el recorrido de la variable debe ser
igual a 1”.

Es decir:
3 3
1 = ∫ k * (2x + 1 ) dx = k * ( x 2 + x ) | = 9k + 3k = 12k
0 0

Entonces: k = 1/12

a) La función propuesta no es de densidad porque no cumple la segunda propiedad. Por lo


2x + 1
tanto debe modificarse. Entonces la nueva función es: P(x) = para 0 ≤ x ≤ 3
12

1 2 6
b) Se pide: f (x < 2 ) =
12 ∫
0
(2x + 1 ) dx =
12
= 0.5

Respuesta: Que "x" sea menor que 2 ocurre en el 50 % de los casos.

c) Se verifica así:

1 2 3
1 2 1 4 1 6
* ∫ (2x + 1 ) dx = * ∫ (2x + 1 ) dx = * ∫ (2x + 1 ) dx =
12 0 12 12 1 12 12 2 12

La distribución de densidad resultante es:

Li-1 - Li f (x)
0-1 2/12
1’ - 2 4/12
2’ - 3 6/12
12/12=1

b) Representación gráfica.

La representación gráfica de una distribución de densidad se realiza mediante un histograma


de probabilidades.

12
Histograma

HISTOGRAMA DE PROBABILIDADES DE LA FUNCIÓN DE DENSIDAD:


1
P(x) = (2x + 1) para 0 ≤ x ≤ 3
12

60%

50%

40%
P(xi) [%]

30%

20%

10%

0%
0-1 1-2 2-3
Li-1 - Li

7. ESTADÍGRAFOS DE POSICIÓN Y DISPERSIÓN ESPERADOS

Son indicadores estadísticos que permiten reducir o sintetizar la información contenida en


una variable en la distribución de probabilidades.

7.1. Esperanza matemática y varianza esperada

Sea E un experimento y S un espacio muestral. Si en dicho espacio se define una función P(x)
en el espacio muestral S, entonces es posible determinar indicadores que definan la posición
y la forma de la distribución, tal como la esperanza matemática y la varianza esperada.

7.1.1. La esperanza matemática

Indica el valor promedio que se desea obtener en una distribución de probabilidades.

a) Función de cuantía

Si la distribución probabilística es una función de cuantía, la esperanza matemática se


obtiene dada la siguiente expresión:

n
E [x ] = ∑ x i P ( x i ) para x = 0, 1, 2,K , n
i=1
Ejemplo.

Sea la siguiente distribución de probabilidad de variable discreta formado a partir del


siguiente experimento aleatorio: En el curso existen 5 mujeres, 3 de las cuales tienen cabello

13
largo y 2 de cabello corto. Se quieren elegir al azar dos de ellas.

x = Número de señoritas de pelo largo

xi P(xi)
0 2/20
1 12/20
2 6/20
ΣP(xi)=1

Resolución.

• Se calcula xi * P(xi) en columna (3)

xi P(xi) xi * P(xi)
0 2/20 0
1 12/20 12/20
2 6/20 12/20
ΣP(xi)=1 24/20
• Luego:
24
E [x ] = = 1.2
20

Conclusión: Al elegir al azar 2 señoritas de pelo corto y largo, se espera obtener en promedio
1.2 señoritas de pelo largo.

b) Función de densidad

Si la expresión matemática es de función de densidad, la esperanza matemática se obtiene


de la siguiente manera:

E [x ] = ∫x
−∞
i f ( x i ) dx para − ∞ ≤ x ≤ ∞

Ejemplo.

Sea la siguiente función de densidad:

1
f (x ) = (2 x + 1 ) para 0 ≤ x ≤ 3
12
Halle la esperanza matemática.

Resolución.

a) Se parte de la definición de esperanza matemática.


E [x ] = ∫x
−∞
f (x ) dx

14
b) Se aplica los datos a la ecuación anterior:

3
1 1 2 1 54
E [x ] = ∫ x [ (2x + 1 )] dx = ( x 3 + x 2 ) = ( + 9 ) = 2.15
0
12 12 3 12 3

Conclusión: El valor medio esperado en la distribución es 2.15.

En general la media aritmética o la esperanza matemática, es un valor que se define dentro


el recorrido de la variable.

7.1.2. Varianza esperada

En toda distribución de probabilidad, a fin de caracterizarla, además de hallar la esperanza


matemática, es necesario determinar o analizar la varianza esperada.

a) Función de cuantía

Si tenemos una función de cuantía, la varianza esperada se define de la siguiente manera:

2
n n
 n 
V(x) = ∑ (x i − µ) P(x i ) = ∑ x P(x i ) −  ∑ x i P(x i ) 
2 2
i siendo: x = 0, 1, 2, 3, ... n.
i =1 i =1  i =1 

Ejemplo.

Sea la siguiente función de cuantía:


1
f (x) = (2x + 1) x = 0, 1, 2, 3
16
Halle la varianza y desviación estándar esperadas.

Resolución.

xi P(xi) xi*P(xi) xi2*P(xi)


0 1/16 0 0
1 3/16 3/16 3/16
2 5/16 10/16 40/16
3 7/16 21/16 63/16
16/16 34/16 106/16

2
106  34 
V[x] = −   = 2.11 S = 2.11 = 1.45
16  16 

34
x= = 2.125
16

15
b) Función de densidad

Si se tiene una función de densidad, la varianza esperada se define de la siguiente manera:


∞ ∞ 2
∞ 
V [x ] = ∫ (x − x ) f(x ) dx = ∫ x f(x ) dx −  ∫ x f(x ) dx  siendo: -∞ < x < ∞
2 2

−∞ −∞  −∞ 

Ejemplo.

Sea la siguiente función de densidad:


1
f (x ) = (2x + 1 ) para 0 < x < 3
12

Halle la varianza esperada.

Resolución:
2
3
1 3 1 
V [x ] = ∫ x * [ * (2x + 1 )] dx −  ∫ x * [ * (2x + 1 )] dx 
2

0
12 0 12 
2
1 4 3 3 1 2 3 2 3
= * ( x + x )|−  * ( x + x )|
12 2 3 0  12 3 2 0
2
1 81 1 9 
= * ( + 9 ) −  * (18 + ) 
12 2  12 2 
1 99 2025 2376 − 2025 351
= ( )− = = = 0.609
12 2 576 576 576

Luego: E [x] = 1.875 (media)


V [x] = 0.609 (varianza)
S [x] = 0.78 (desviación estándar)

7.2. Moda esperada

La moda en una distribución de probabilidad, corresponde a aplicar las condiciones de un


máximo.

a) Función de cuantía

Si f(x) es una distribución de cuantía, la moda se determina aplicando la definición.

Ejemplo.

Sea la función de cuantía del número de señoritas de cabello largo:

16
xi P(xi)
0 2/20
1 12/20
2 6/20
ΣP(xi)=1

Halle la moda esperada.

Se procede de la siguiente manera:

a) Se encuentra el valor de probabilidad más alto: P(xi) = 12/20.


b) El correspondiente valor de la variable es la moda:

Moda = 1

Conclusión: Lo más usual es elegir a una señorita de cabello largo entre dos, cuando
tenemos 5 señoritas, de las cuales 3 son de cabello largo.

b) Función de densidad

Si f(x) es una distribución de densidad, se puede determinar la moda mediante tres


procedimientos:

1. Aplicando el método para hallar un máximo absoluto en un intervalo:

a) Halle las coordenadas de x de todos los puntos críticos de primer orden de la función en
el intervalo a ≤ x ≤ b (Un punto crítico es aquel que se obtiene igualando a cero o a no
existe la primera derivada de una función: f ’(x) = 0).
b) Calcule f(x) en estos valores críticos y en los puntos extremos x = a y x = b.
c) Seleccione el valor mayor de f(x) obtenido en el paso 2. Este es el máximo absoluto, que
puede ser confirmado mediante el criterio de la segunda derivada: f ’’(x) < 0.

Ejemplo.
Sea la siguiente función de densidad: f (x) =
3
8
( −2x 2 + 4x ) para 0 ≤ x ≤ 2 . Halle la moda.
Resolución.

a) Se determina la primera derivada y se iguala a cero para obtener los puntos críticos (se
toman en cuenta aquellos que se encuentran dentro el rango de la variable):

f '(x) = −4x + 4 = 0 x =1

b) Se determina la segunda derivada para comprobar si el punto crítico hallado es un


máximo, mínimo o punto de inflexión:

f ''(x) = −4 >0 Máximo

Conclusión: La moda es 1.

17
2. Aplicando la fórmula empírica para intervalos constates o no constantes.
P i+1
Mo = L i −1 + a i+1 * ai Mo = P i+1 * +
P i+1 + P i −1
a i L i −1
+
P i+1 P i −1
a i+1 a i −1
Ejemplo.

Sea la siguiente función de densidad:


1
f (x ) = (2 x + 1 ) para 0 ≤ x ≤ 3
12

Li-1 - Li P(xi)
0–1 2/12
1–2 4/12
2–3 6/12
12/12
Halle la moda.

Resolución.

a) Se determina la fila de clase modal: Fila 3. (Porque esa fila es la que tiene la probabilidad
más alta)
b) Se determinan los elementos de la fórmula empírica para la moda de intervalos
constantes:

Li-1 = 2 Pi-1 = 4/12 Pi+1 = 0 ai = 1

c) Se reemplazan los valores hallados en la fórmula:

0
Mo = (1) + 2 = 2
0 + 124

Conclusión: La moda es 2.

3. Transformando la distribución tipo III en una tipo II mediante las marcas de clase y
aplicando la definición de la moda.

Ejemplo.

Sea la siguiente función de densidad:

1
f (x ) = (2 x + 1 ) para 0 ≤ x ≤ 3
12

18
Li-1 - Li Li −1 + L i P(xi)
xi =
2
0–1 0.5 2/12
1–2 1.5 4/12
2–3 2.5 6/12
12/12

Halle la moda.

Resolución.

a) Se transforma la distribución tipo III en tipo II como se ve en la tabla en la columna 2,


mediante marcas de clase.
b) El valor correspondiente de la variable para la probabilidad más alta es la moda.

Conclusión: La moda es 2.5.

Se puede observar que existe diferencia entre el método b) y el c). Esto se debe a que en el
último se realiza una aproximación.

7.3. Mediana esperada

La mediana esperada es el valor de la variable aleatoria que divide a una distribución de


probabilidades en dos partes igualmente proporcionales.

a) Función de cuantía

El procedimiento para hallar la mediana esperada en una función de cuantía es el siguiente:

• Se determina los valores de probabilidad acumulada.

• Se ubica el valor 0.5 entre dos valores consecutivos de probabilidad acumulada:


Pac (x i −1 ) ≤ 0.5 ≤ Pac (x i ) , tal que si:

• Pac (x i ) > 0.5 entonces Me = x i


x + x i +1
• Pac (x i ) = 0.5 entonces Me = i
2

Ejemplo.
1
Sea la siguiente función de cuantía: f (x) = (2x + 1) x = 0, 1, 2, 3
16
Halle la mediana esperada.

Resolución.

• Halle la distribución y sus probabilidades acumuladas:

19
xi P(xi) Pac (xi)
0 1/16 = 0.0625 0.0625
1 3/16 = 0.1875 0.2500 0.5
Fila i 2 5/16 = 0.3125 0.5625
3 7/16 = 0.4375 1.0000
16/16

• Ubique 0.5 entre dos valores de probabilidad acumulada:

Pac (x i −1 ) = 0.25 ≤ 0.5 ≤ Pac (x i ) = 0.5625

• Se cumple que: Pac (x i ) = 0.5625 > 0.5 entonces Me = x i = 2

Conclusión: La mediana esperada es 2.

b) Función de densidad

La mediana esperada de una función de densidad puede ser calculada por tres métodos:

1. Mediante la siguiente integral:

Me ∞
1

−∞
f (x) dx = ∫ f (x) dx = 2
Me
−∞≤ x ≤∞

Ejemplo.

Sea la siguiente función de densidad:


1
f (x) = (2x + 1) 0≤ x ≤3
12

Halle su mediana esperada.

Resolución.

• Se calcula la integral:
Me Me
1 1 2 1 1
∫0 12 (2x + 1) dx = 12 (x + x) 0 = 12 (Me + Me) = 2
2

Me 2 + Me − 6 = 0

• Se resuelve la ecuación resultante:

Me = 2 Me = −3

Conclusión: La mediana esperada de la distribución es 2.

20
2. Mediante la siguiente fórmula empírica para distribuciones tipo III:

0.5 − Pac (x i −1 )
Me = Li −1 + (a i )
P(x i )

Ejemplo.

Se usará el ejemplo anterior. Se procede de la siguiente manera:

• Obtenga la tabla tipo III de distribución de probabilidades y las probabilidades


acumuladas:

Li-1 - Li P(xi) Pac(xi)


0–1 2/12 = 0.1667 0.1667
Fila i 1–2 4/12 = 0.3333 0. 5000 0.5
Fila i+1 2 – 3 6/12 = 0.5000 1
12/12

• Ubique 0.5 entre dos valores de probabilidad acumulada: En este caso el valor coincide
con la de la fila 2, que se constituye en la fila de clase mediana.

• Determine los valores de la fórmula empírica:

Li-1 = 1 Pac(xi-1) = 2/12 P(xi) = 4/12 ai = 1

• Reemplace los valores hallados en la fórmula empírica:


2
0.5 − Pac (x i −1 ) 0.5 −
Me = Li −1 + (a i ) = 1 + 12 (1) = 2
P(x i ) 4
12

Conclusión: La mediana esperada es 2.

3. Mediante la transformación de la distribución tipo III en tipo II, seguido del


procedimiento para el cálculo de la mediana para esa distribución:

Ejemplo.

Se seguirá usando el mismo ejemplo.

Se procede de la siguiente manera:

• Se transforma la distribución tipo III en tipo II mediante las marcas de clase (columna 2) y
se obtienen las probabilidades acumuladas (columna 4):

21
Li-1 - Li xi P(xi) Pac(xi)
0–1 0.5 2/12 = 0.1667 0.1667
Fila i 1–2 1.5 4/12 = 0.3333 0. 5000 0.5
Fila i+1 2 – 3 2.5 6/12 = 0.5000 1
12/12

• Se ubica 0.5 entre dos valores de probabilidad acumulada: En este caso coincide con el
valor de la fila 2 que es la fila de clase mediana. Por lo tanto la mediana se halla por
medio de la siguiente fórmula:

x i + x i +1 1.5 + 2.5
Me = = =2
2 2

Conclusión: La mediana esperada de la distribución es 2.

Nota: Los tres métodos coinciden en el valor calculado de la mediana esperada.

8. REGLAS DE COMPOSICIÓN PARA EL CÁLCULO DE PROBABILIDADES

8.1. Generalidades

Sea un experimento aleatorio “E” que tiene un espacio muestral “S”, donde sus resultados
posibles se organizan atendiendo a dos criterios de ordenación (xi , yj). La presentación de
estos resultados se efectúa en un cuadro de doble entrada, donde nij indica el número de
veces que aparece el par (xi , yj); en consecuencia, una distribución bidimensional de
probabilidades se presenta en la siguiente forma general:

yj y1 y2 ... ys
xi
x1 n11 n12 ... n1s
x2 n21 n22 ... n2s
: : : : :
xr nr1 nr2 ... nrs
r s
n = ∑ ∑ n ij
i=1 j=1

donde:
n ij Casos favorables
P ij = =
n Casos posibles

y Pij se lee como probabilidad del evento (xi , yj), que es la probabilidad conjunta.

Utilizando la información de la tabla de eventos o sucesos, dispuestos en forma de una


distribución bidimensional, podemos determinar las siguientes reglas de composición.

22
8.2. Probabilidad marginal

Si en la distribución bidimensional de probabilidades se prescinde de uno de los criterios de


ordenación (digamos yj) y estamos interesados en los eventos que resultan de considerar el
criterio de ordenación xi, se habrá definido la probabilidad marginal de xi, que se denota por
el símbolo P(xi) y su cálculo se efectúa de la siguiente manera:

s
n i1 n i2 n i3 n
P ( x i ) = ∑ P ( x i, y j ) = + + + . . . + is
j=1 n n n n

= P(xi , y1) + P(xi , y2) + P(xi , y3) + . . . + P(xi , ys)

Si se trata de la probabilidad marginal de yj , el cálculo se efectúa de la siguiente manera:

r
n1j n 2j n 3j n
P ( y j ) = ∑ P ( x i, y j ) = + + + . . . + rj
i=1 n n n n

= P(x1 , yj) + P(x2 , yj) + P(x3 , yj) + . . . + P(xr , yj)

8.3. Regla de adición

Se busca determinar la probabilidad de la unión de dos sucesos. Según que los sucesos
sean mutuamente excluyentes o no, la regla de la adición se determina de las dos siguientes
formas:

a) Regla de adición para sucesos mutuamente excluyentes

P(x ∪ y) = P(x) + P(y)

donde x y y son sucesos mutuamente excluyentes y sus probabilidades son marginales.

b) Regla de adición para dos sucesos cualquiera

P(x ∪ y) = P(x) + P(y) - P(x,y)

siendo P(x,y) la probabilidad conjunta.

Nota: Para resolver problemas de adición de eventos en general, debe utilizarse la regla
correspondiente a dos sucesos cualquiera, salvo que se tenga como dato que los sucesos
sean mutuamente excluyentes.

Para entender mejor la regla de adición de eventos se usan los diagramas de Venn
(investigador inglés, 1834-88), que son representaciones gráficas de los resultados de un
experimento aleatorio. Para elaborar un diagrama de Venn, se representa al espacio
muestral por un rectángulo, mientras que los eventos aparecen como regiones dentro del
rectángulo, generalmente en forma de círculos.

Las regiones sombreadas de los cuatro diagramas de Venn de la figura siguiente,


23
representan respectivamente: el evento A, su complemento, la unión de los eventos A y B y
la intersección de A y B (para sucesos que no son mutuamente excluyentes y para los que si
son).

A
A

S S
A A’
A y A’ son mutuamente excluyentes

A B A B

S S
A∪B A∩B
A y B no son mutuamente excluyentes

A B A B

S S
A∪B A∩B
A y B son mutuamente excluyentes

El lector puede darse cuenta por qué en la suma de dos eventos que no son mutuamente
excluyentes, se debe restar la intersección (se estaría sumando dos veces el área
sombreada).

Ejemplo.

En la figura anterior, si A es el evento en el que cierto estudiante lleva un curso de cálculo y


B es el evento en el que el estudiante está tomando un curso de física, ¿qué eventos están
representados por las regiones sombreadas de los seis diagramas de Venn?

Resolución.

Primer diagrama: Representa el evento en que el estudiante lleva el curso de cálculo.


24
Segundo diagrama: El evento en que el estudiante no lleva el curso de cálculo.
Tercer diagrama: El estudiante está tomando un curso de cálculo y/o uno de física.
Cuarto diagrama: El evento en el que lleva los dos cursos.

No se utilizan los dos últimos diagramas, ya que los eventos no son mutuamente
excluyentes, a menos que los dos cursos estén programados a la misma hora y en las
mismas fechas.

8.4. Probabilidad condicional

Dados dos sucesos o eventos xi , yj se define la probabilidad condicional cuando se busca


determinar la probabilidad del evento xi dado el evento yj.

La probabilidad de un suceso determinado, condicionado a otro suceso se denota en


símbolos, de la siguiente manera:

P(x / y) y se lee: "Probabilidad de x dado y".


P(y / x) y se lee: "Probabilidad de y dado x".

Esta probabilidad se determina dividiendo la probabilidad conjunta por la probabilidad


marginal:
P (x , y )
P (x /y ) = Si P(y) > 0
P (y )
P (x , y )
P (y /x ) = Si P(x) > 0
P (x )

8.5. Regla multiplicativa

Despejando las dos formas que expresan la probabilidad condicional y la probabilidad


conjunta se tiene:

P(x, y) = P(y) * P(x / y) (1)

P(x, y) = P(x) * P(y / x) (2)

o mejor: P(x, y) = P(x) * P(y / x) = P(y) * P(x / y) (3)

La ecuación (3) expresa la regla multiplicativa para dos eventos cualquiera.

Si P(y / x) = P2 (y) (4)


y P(x / y) = P1 (x) (5)

Reemplazando (4) y (5) en (3), tenemos:

P(x, y) = P(x) * P2 (y) = P1 (x) * P(y)

que expresa la regla multiplicativa para dos sucesos independientes.

25
8.6. Probabilidad completa o total

Sea un atributo xi y un atributo yj compuesto por eventos mutuamente excluyentes:

y j = y 1 , y 2 , . . . , ys

La probabilidad total o completa se da cuando se desea averiguar la probabilidad del evento


xi en base a sus intersecciones con los eventos del atributo yj.

s
P (x ) = P (x, y1) + P (x, y 2) + P (x, y 3) + . . . + P (x, y s) = ∑ P (x, y j)
j=1

Aplicando al segundo miembro la regla multiplicativa, se tiene:

P (x ) = P ( y1) *P (x / y1) + P ( y 2) * P (x / y 2) + . . . + P ( y s ) *P (x / y s )
s
= ∑ P ( y j ) * P (x / y j )
j=1

que expresa la regla de cálculo para la probabilidad completa.

8.7. Teorema de Bayes

Permite determinar la probabilidad de las hipótesis yj dado el evento xi. Se expresa en forma
de una probabilidad condicional de la siguiente manera:

Aplicando la propiedad multiplicativa al numerador y la definición de probabilidad total o


completa al denominador de la fórmula de probabilidad condicional, se tiene la siguiente
expresión:

P (x i y j ) P (y j ) * P (x i / y j )
P (y j /x i ) = = s
P (x i )
Σ P (y
j=1
j ) * P (x i / y j )

8.8. Ejemplo

Mediante el siguiente ejemplo se mostrará el cálculo de probabilidades usando todas las


reglas anteriores.

Sea xi = estrato de votantes: joven, adulto y viejo; yj = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución:

yj MNR MIR MBL


xi
J 2 6 4 12
A 7 3 5 15
V 6 7 0 13
15 16 9 40

26
Mediante reglas de composición resolver las siguientes probabilidades:

1) Probabilidad de ser viejo o del MBL

• Se trata de hallar la probabilidad de la unión de dos sucesos.

P(x ∪ y) = P(x) + P(y) - P(xy)

• En términos de las modalidades de la distribución:

P(V ∪ MBL) = P(V) + P(MBL) - P(V, MBL)

• La probabilidad buscada utilizando los datos de la distribución, es:

13 9 0 22
P(V ∪ MBL) = + − = = 0.55
40 40 40 40

Conclusión: La probabilidad de ser viejo o del MBL es del 55%.

2) Probabilidad de ser adulto dado que se es del MNR.

• Se trata de una probabilidad condicional:

P (x , y )
P (x /y ) = Si P(y) > 0
P (y )

• En términos de las modalidades de la distribución:

P (A, MNR )
P (A /MNR ) =
P (MNR )

donde: P(A, MNR) es la probabilidad conjunta y se lee en la tabla.

7
P (A, MNR ) =
40

y P(MNR) es la probabilidad marginal tal que:

15
P(MNR) =
40
• Reemplazando valores:
7
7
P (A /MNR ) = 40 = = 0.47
15 15
40

27
Conclusión: La probabilidad de ser adulto dado que es del MNR es del 47%.

3) Verifique si la probabilidad marginal de ser del MIR es de 15/40.

• Se trata de aplicar la probabilidad completa, donde:

3
P (x ) = ∑ P (x, y j )
j=1
3
P (x ) = ∑ P ( y j ) * P (x / y j )
j=1

• En términos de las modalidades:

P(MIR) = P(J)*P(MIR /J) + P(A)*P(MIR /A) + P(V)*P(MIR / V)


14 6 15 3 13 7
P (MIR ) = ( )( ) + ( )( ) + ( )( )
40 12 40 15 40 13

6 3 7 16
= + + =
40 40 40 40

Conclusión: Por lo tanto se verifica que la probabilidad de ser del MIR no es 15/20 sino
16/40.

4) Verifique si la probabilidad de ser joven y del MIR es de 7/40.

• Se trata de aplicar la regla multiplicativa:

P(x, y) = P(x) * P(y / x) = P(y) * P(x / y)

• En términos de las modalidades de la distribución:

P(J, MIR) = P(MIR) * P(J / MIR) = P(J) * P(MIR / J)

• Aplicando los datos de la distribución de probabilidades:

P(J, MIR) = [ P(J, MIR) + P(A, MIR) + P(V,MIR) ] * [ P(J / MIR) ]

6 3 7 6 16 6 6
=[ + + ] *[ ] = * =
40 40 40 16 40 16 40

Conclusión: No es cierto que la probabilidad de ser joven y del MIR sea 7/40. Su resultado es
6/40.

5) Demuestre que la probabilidad de ser adulto dado que es del MBL es de 5/9.

• Se trata del teorema de Bayes.

28
P (x i y j ) P (y j ) * P (x i / y j )
P (y j /x i ) = = s
P (x i )
Σ P (y
j=1
j ) * P (x i / y j )

• En términos de las modalidades de la distribución:

P (MBL, A )
P (A /MBL ) =
P (MBL )

15 5 5
)( ) (
P (A /MBL ) = 40 15 = 40 = 5
9 9 9
40 40

Conclusión: Se verifica que la probabilidad de ser adulto dado que es del MBL es de 5/9.

9. CÁLCULO DE PROBABILIDADES UTILIZANDO DIAGRAMA DE ÁRBOL

A veces es conveniente pasar la información que contiene una distribución bidimensional a


un diagrama de árbol o viceversa. Se vio en este capítulo esta técnica para hallar el espacio
muestral.

Ejemplo.

Sea xi = estrato de votantes: joven, adulto y viejo; yj = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución:

yj MNR MIR MBL


xi
J 2 6 4 12
A 7 3 5 15
V 6 7 0 13
15 16 9 40

Pase la información a un diagrama de árbol.

Resolución:

En primer lugar se dará un instructivo de lo que significa cada rama de un diagrama de árbol
y cómo hallar las probabilidades.

• Las primeras ramas del árbol presentan sucesos aleatorios que tienen probabilidades
marginales. Se puede comenzar por cualquier clasificación. Para diagramarlas debe
hacerse esta pregunta: Si se selecciona al azar una persona de entre las 40, ¿cuál es la
clasificación de su edad?

• Las segundas ramas de árbol son sucesos dependientes que presentan probabilidades
condicionales. Para diagramarlas debe hacerse la siguiente pregunta: habiendo
29
determinado la edad de la persona elegida al azar, ¿de qué partido es?

• En otras palabras se está determinando el espacio muestral del experimento aleatorio, es


decir el conjunto de sus posibles resultados y sus probabilidades respectivas.

• Para hallar las probabilidades conjuntas en un diagrama de árbol se utiliza la regla


multiplicativa. Si se quiere hallar una probabilidad marginal que no se encuentra en las
primeras ramas, se utiliza la probabilidad total, y para hallar una probabilidad condicional
que no se encuentra en las segundas ramas se utilizará el teorema de Bayes.

Se muestra a continuación el diagrama:

P. marginales P. condicionales P. conjuntas

2/12 P(J, MNR) = P(J)*P(MNR/J) = (12/40)*(2/12) = 2/40


MNR
6/12 P(J, MIR) = P(J)*P(MIR/J) = (12/40)*(6/12) = 6/40
J MIR
12/40 4/12 P(J, MBL) = P(J)*P(MBL/J) = (12/40)*(4/12) = 4/40
MBL
7/15 MNR P(A, MNR) = P(A)*P(MNR/A) = (15/40)*(7/15) = 7/40
15/40 3/15 P(A, MIR) = P(A)*P(MIR/A) = (15/40)*(3/15) = 3/40
A MIR
5/15 MBL P(A, MBL) = P(A)*P(MBL/A) = (15/40)*(5/15) = 5/40
13/40
6/13 P(V, MNR) = P(V)*P(MNR/V) = (13/40)*(6/13) = 6/40
MNR
V 7/13 P(V, MIR) = P(V)*P(MIR/V) = (13/40)*(7/13) = 7/40
MIR
0/13 P(V, MBL) = P(V)*P(MBL/V) = (13/40)*(0/13) = 0
MBL

P. totales

P(MNR) = P(MNR, J)+P(MNR, A)+P(MNR, V) = (2/40)+(7/40)+(6/40) = 15/40


P(MIR) = P(MIR, J)+P(MIR, A)+P(MIR, V) = (6/40)+(3/40)+(7/40) = 16/40
P(MBL) = P(MBL, J)+P(MBL, A)+P(MBL, V) = (4/40)+(5/40)+(0/40) = 9/40

P. condicionales (Teorema de Bayes)

P(J/MNR) = P(MNR, J)/P(MNR) = (2/40)/(15/40) = 2/15


P(J/MIR) = P(MIR, J)/P(MIR) = (6/40)/(16/40) = 6/16
P(J/MBL) = P(MBL, J)/P(MBL) = (4/40)/(9/40) = 4/9
P(A/MNR) = P(MNR, A)/P(MNR) = (7/40)/(15/40) = 7/15
P(A/MIR) = P(MIR, A)/P(MIR) = (3/40)/(16/40) = 3/16
P(A/MBL) = P(MBL, A)/P(MBL) = (5/40)/(9/40) = 5/9
P(V/MNR) = P(MNR, V)/P(MNR) = (6/40)/(15/40) = 6/15
P(V/MIR) = P(MIR, V)/P(MIR) = (7/40)/(16/40) = 7/16
P(V/MBL) = P(MBL, V)/P(MBL) = (0/40)/(9/40) = 0
30
Algunas características del diagrama de árbol son:

• La suma de probabilidades conjuntas es 1.


• La suma de probabilidades para sucesos mutuamente excluyentes es 1.

Ejemplo.

El administrador de la unidad operativa de tránsito realizó un estudio sobre el número de


accidentes que hay en la ciudad con respecto a la edad del conductor. El arboligrama con
las probabilidades porcentuales es:

88.24 0

21-41 1
42.39 4.22
≥2
90.07 0
39.87
7.00
41’-61 1

≥2
0
6.72
61’-71 1
2.96
≥2

El administrador quiere estimar cuantas personas de cada categoría existirán, si este año
hay 4194 nuevos conductores.

Resolución.

En primer lugar, se pueden determinar las probabilidades del arboligrama que faltan,
sabiendo que la suma de probabilidades de eventos mutuamente excluyentes debe ser de
uno.

P(61'− 71) = 100 − 42.39 − 39.87 = 17.74

P(1/ 21 − 41) = 100 − 88.24 − 4.22 = 7.54

P(≥ 2 / 41'− 61) = 100 − 90.07 − 7.00 = 2.93

P(0 / 61'− 71) = 100 − 6.72 − 2.96 = 90.32

Luego, se construye el cuadro bidimensional y se asignan variables a todas las categorías:

31
Edad/n° accidentes 0 1 ≥2 Total
21-41 A D G N
41’-61 B E H O
61’-71 C F I P
total K L M 4194

Haciendo uso de las reglas de cálculo de probabilidades, se procede a hallar el valor de cada
variable.

• Con probabilidades marginales:

N
P(21 − 41) = 0.4239 = N = 0.4239(4194) = 1778
4194

De la misma manera se puede hallar el valor de O:

O = 0.3987(4194) = 1672

Restando del total se halla el valor de P:

P = 4194 − 1778 − 1672 = 744

• Con probabilidades condicionales:

A A
P(0 / 21 − 41) = 0.8824 = = A = 0.8824(1778) = 1569
N 1778

De la misma manera se procede para hallar el valor de D:

D = 0.0754(1778) = 134

Restando del total de personas de edad entre 21 a 41 años, se obtiene G:

G = 1778 − 1569 − 134 = 75

• Con probabilidades condicionales:

Igualmente se hallan los valores para B, E y H:

B = 0.9007(1672) = 1506
E = 0.007(1672) = 117
H = 1672 − 1506 − 117 = 49

• Con probabilidades condicionales:

La fila restante, se puede hallar mediante el mismo método:

32
C = 0.9032(744) = 672
F = 0.0672(744) = 50
I = 744 − 672 − 50 = 22

Por último los totales de columna se obtienen sumando los valores de cada columna:

K = 1569 + 1506 + 672 = 3747


L = 134 + 117 + 50 = 301
M = 75 + 49 + 22 = 146

El cuadro bidimensional resultante es:

Edad/n° accidentes 0 1 ≥2 Total


21-41 1569 134 75 1778
41’-61 1506 117 49 1672
61’-71 672 50 22 744
total 3747 301 146 4194

10. GENERALIZACIÓN DE LAS REGLAS PARA EL CÁLCULO DE


PROBABILIDADES

Se han mostrado las reglas para el cálculo de probabilidades cuando se tiene una
distribución bidimensional. Sin embargo se puede presentar el caso en el que exista ya no
dos sino tres o más clasificaciones. Para este tipo de problemas, se deberán generalizar las
reglas para el cálculo de probabilidades, para lo cual se considera un árbol que tiene tres
ramificaciones o eventos dependientes, cada uno de los cuales tiene dos resultados
posibles:

P. condicional P. conjuntas

P. condicional P(E/A,C)
E P(A, C, E) = P(A) + P(C / A) + P(E / A, C)
P. marginal P(C/A) C
P(F/A,C) F P(A, C, F) = P(A) + P(C / A) + P(F / A, C)
A
P(A) P(E/A,D) E P(A, D, E) = P(A) + P(D / A) + P(E / A, D)
P(D/A) D
P(F/A,D) F P(A, D, F) = P(A) + P(D / A) + P(F / A, D)

P(E/B,C) E P(B, C, E) = P(B) + P(C / B) + P(E / B, C)


P(C/B) C
P(F/B,C) F P(B, C, F) = P(B) + P(C / B) + P(F / B, C)
P(B)
B
P(E/B,D) E P(B, D, E) = P(B) + P(D / B) + P(E / B, D)
P(D/B) D
P(F/B,D) F P(B, D, F) = P(B) + P(D / B) + P(F / B, D)

33
El lector puede darse cuenta qué pasaría si existen 4 eventos dependientes (en la cuarta
ramificación también se tendrían probabilidades condicionales).

Regla de la suma:

La suma de tres eventos dependientes, por ejemplo de los tres primeros, será:

P(A ∪ C ∪ E) = P(A) + P(C) + P(E) − P(A, C) − P(A, E) − P(C, E) + P(A, E, C)

El uso de diagramas de Venn puede ayudar a visualizar y comprender de mejor manera la


relación entre tres eventos. En la figura se puede observar que los círculos de tres eventos
dividen el espacio muestral en 8 zonas numeradas y es sencillo determinar si los eventos
correspondientes pertenecen a X o X’, a Y o Y’ y a Z o Z’.

X Y

2
7 5
1
4 3

6
8

Z
S

Ejemplo.

Si en el anterior diagrama, X es el evento de que servirán hamburguesas en el día de campo


de la compañía, Y es el evento de que se servirá cerveza y Z es el evento de que se servirá
una torta de chocolate, exprese con palabras los eventos que se representan por medio de
las siguientes zonas del diagrama de Venn:

a) Zona 3.
b) Zonas 1 y 2.
c) Zonas 4, 6, 7 y 8.

Resolución.

a) Puesto que esta zona parte de Y y Z, pero no de X, representa el evento de que en el día
de campo se servirá cerveza y torta de chocolate, pero no hamburguesas.

b) Ya que esta zona pertenece tanto a X como a Y, representa el evento de que se servirán
hamburguesas y cerveza

c) Dado que estas zonas son ajenas a Y, constituye el evento de que no se servirá cerveza.

34
Ejemplo.

Con base en el siguiente diagrama de Venn, sea A el evento de que un ejecutivo de alto
rango de una compañía esté en la cafetería de su empresa, B el evento de que se encuentre
en la oficina de otro ejecutivo y C el evento de que se encuentre jugando al golf con un
cliente. Hallar la probabilidad de que una persona en un momento específico lo encuentre en
alguno de esos tres lugares.

A B
0.24 0.06 0.19
0.04
0.16 0.11

0.09
C

S
Resolución.

Siguiendo la ecuación de la suma de tres eventos, se tiene:

P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A, B) − P(A, C) − P(B, C) + P(A, B, C)

Reemplazando valores:

P(A ∪ B ∪ C) = 0.24 + 0.19 + 0.09 − 0.06 − 0.16 − 0.11 + 0.04 = 0.23

Respuesta: La probabilidad de que una persona encuentre al ejecutivo en alguno de los tres
lugares es del 23%.

Acción: Si una persona quiere encontrarlo deberá ir a su oficina o a la sala de reuniones de


la empresa.

11. DISTRIBUCIÓN BIDIMENSIONAL DE PROBABILIDADES

Una distribución de probabilidad, cuando corresponde a una variable aleatoria continua


bidimensional, requiere cumplir con las dos condiciones siguientes:

a) f (x, y) ≥ 0
∞ ∞
b) ∫ ∫
−∞ −∞
f (x, y) dx dy = 1 ; para: −∞ ≤ x ≤ ∞ y −∞≤ y≤∞

Luego: 0 ≤ f (x, y) ≤ 1

La probabilidad que el par (x,y) sea para a1 ≤ x ≤ b1 ; y para a 2 ≤ y ≤ b 2 , se expresa de la

35
siguiente manera:
b1 b2
P(a1 ≤ x ≤ b1; a 2 ≤ y ≤ b 2 ) = ∫ ∫ f (x, y) dx dy
a1 a2

La distribución bidimensional de probabilidades de variable aleatoria continua tiene dos


distribuciones marginales:

f 1 (x ) = ∫ f (x, y ) dy
−∞
distribución marginal de "x"

f 2 (y ) = ∫ f (x, y ) dx
−∞
distribución marginal de "y"

La distribución de probabilidad acumulada para la variable aleatoria bidimensional continua:

x o y0
F (x o, y o ) = ∫ ∫ f (t , t
−∞ −∞
1 2 ) dt1 dt 2

donde t1 y t2 son variables auxiliares de trabajo.

Para expresar la probabilidad de que la variable xi esté en el par (x1, y1) y que la variable yj
esté en el par (x2, y2) en términos de la función de distribución, se procede de la siguiente
manera:
• Se usa un sistema de ejes coordenados, donde en el eje de las abscisas se representan
valores de xi y en el eje de ordenadas los valores de yj .

• En cada eje se representan los valores del par (a1,b1) y del par (a2,b2).

• Se obtiene un cuadrilátero con los siguientes puntos de coordenadas que se observan en


el gráfico.
yj

(a1, b2) (b1, b2)


b2

(a1, a2) (b1, a2)


a2

a1 b1 xi

• Las áreas diferentes en el gráfico permiten determinar la probabilidad:

P(a1 < x < b1 ; a2 < y < b2) = F(b1 , b2) - F(b1 , a2) - F(a1 , b2) + F(a1 , a2)

36
b1 b2
∫ ∫
a1 a2
f (x, y) dx dy

Conocida la forma de cálculo de una probabilidad conjunta y de la probabilidad marginal es


posible definir la probabilidad condicional:

f (x, y )
(1 ) f (x /y ) = si f 2 (x ) > 0
f 2 (y )
f (x, y )
(2 ) f (y /x ) = si f 1 (x ) > 0
f 1 (x )

Ejemplo.

Suponga que la función de densidad de probabilidad conjunta para las variables no


negativas x e y es f (x, y) = xe− x e − y . Halle la probabilidad que 0 ≤ x ≤ 1 y 0≤ y≤2

Resolución:

• La integral a resolver es la siguiente:

1 2
P(0 ≤ x ≤ 1; 0 ≤ y ≤ 2) = ∫ ∫ xe − x e − y dy dx
0 0
• Se resuelve primero la integral interna:

2 2 1 e2 − 1
∫0
e − y dy = − e− y 0 = −e −2 + 1 = −
e2
+ 1 =
e2

• Se reemplaza la integral interna y se resuelve la integral externa:

 e2 − 1 1 −x  e2 − 1   −x 1
1
 =  e − 1   − xe − x − e − x  1
2

 e2  ∫0 ∫0
−x
xe dx =  e 2   − xe + e dx
   
0   e 2   0

 e2 − 1 −1  e 2 − 1   −2   e 2 − 1   e − 2 
 e2    − 2e + 1
  e 2   e + 1 =  e 2   e  = 0.2285
=
       

Conclusión: La probabilidad conjunta que 0 ≤ x ≤ 1 y 0 ≤ y ≤ 2 es del 22.85%.

Ejemplo.

Suponga que x representa el tiempo (en minutos) que una persona pasa con un agente
mientras elige una póliza de seguro de vida e y el tiempo que el agente emplea en hacer el
papeleo una vez que el cliente se ha decidido. Usted acuerda encontrarse con un agente de
seguros para suscribir una póliza de seguro de vida. Si la función de densidad de
probabilidad conjunta de x e y es:

37
1 − 30x −10y
f (x, y) = e e
300
Halle la probabilidad de que la operación requiera más de media hora.

Resolución.

Se quiere hallar: P(x + y > 30) = 1 − P(x + y ≤ 30)

Se dibuja la inecuación y se plantea la región de integración:

30 Región:
y = 30 − x
0 ≤ x ≤ 30
0 ≤ y ≤ 30 − x
R

30

Se plantea la integral:
30 30 − x 1 − 30x −10y
P(x + y ≤ 30) = ∫ ∫ e e dy dx
0 0 300
Se resuelve:
30− x
−30
10 30  − 30x −10y  1 30 − 30x  x10 
300 ∫0 
=− e e  dx = − ∫ e  e − 1 dx
 0
30 0  
30
1  30 2x30−90 30 −
x
 1  30 2x30−90 − 
x
= − ∫ e dx − ∫ e dx  = −  e
30
+ 30 e 
30
30  0 0
 30  2 0

1 1 1
=− + 3 − + 1 = 0.4730
2e 2e e

La probabilidad buscada es:

P(x + y > 30) = 1 − P(x + y ≤ 30) = 1 − 0.4730 = 0.5269

Respuesta: La probabilidad de que la operación completa requiera más de media hora es


de 52.69%.

Acción: Si usted no tiene disponibilidad de media hora, entonces vuelva a programar su cita
para obtener una póliza de seguro de vida.

38
EJERCICIOS DE CLASE

Espacio muestral.

1. Dé una lista de los posibles resultados que se consiguen al lanzar dos dados. Dibuje el
arboligrama y un cuadro de doble entrada.

2. ¿Cuáles de los siguientes resultados son mutuamente excluyentes en el lanzamiento de


dos dados?

a) Un total de 5 y un 5 en un dado.
b) Un total de 7 y un número par de puntos en ambos dados.
c) Un total de 10 puntos y un 4 en un dado.

Distribución de cuantía.

3. Como se sabe, la respuesta a una pregunta de verdadero o falso es correcta o incorrecta.


Considere que un examen está formado por 3 preguntas de este tipo, y un estudiante no
sabe nada sobre el tema.

a) Construya la tabla de distribución de cuantía.


b) ¿Cuál es la probabilidad de que el estudiante responda todas las preguntas mal?
c) ¿Cuál es la probabilidad de que el estudiante responda por lo menos una bien?

4. El Ministerio de Informaciones sobre asuntos políticos emite 17 de cada 20 noticias para


evitar la disminución de imagen del gobierno que representa. Se seleccionan 3 noticias
emitidas por dicho Ministerio al azar.

a) Cuál es la probabilidad de que se encuentren 2 noticias que vayan en desmedro de la


imagen del gobierno?
b) Cuál es la probabilidad de que puedan encontrarse a lo más 2 noticias que cuiden la
imagen del gobierno?

5. En Alke se acaba de recibir un embarque de 10 aparatos de TV. Poco después de


recibirlos, el fabricante llamó para informar que por descuido habían enviado tres aparatos
defectuosos. Se decidió probar dos de éstos. ¿Cuál es la probabilidad de que ninguno de
los dos esté defectuoso?.

6. Un profesor tiene un conjunto de 15 preguntas de opción múltiple referente a Estadística I.


Cuatro de estas preguntas se relacionan con distribuciones de probabilidades. ¿Cuál es la
probabilidad que al menos una de estas preguntas sobre distribuciones de probabilidad
aparezca en el examen de tres preguntas del próximo lunes?

7. En un día veraniego muy caluroso, 10% de los trabajadores de producción de una


empresa están ausentes del trabajo. Se van a seleccionar al azar 4 obreros para un
estudio especial a profundidad sobre el ausentismo.

a) ¿Cuál es la variable aleatoria en este problema ?


b) ¿Tal variable es discreta o continua? ¿Por qué?
39
c) ¿Cuál es la probabilidad de seleccionar al azar 4 nombres de trabajadores y descubrir
que ninguno está ausente?
d) Represente la distribución mediante una gráfica.

8. Entre los quince solicitantes para tres puestos en un periódico, diez son graduados de
universidad. Si las selecciones se hacen al azar.

a) Determine la distribución de probabilidad, definiendo la variable como el número de


graduados de universidad que solicitan los puestos.
b) ¿Cuál es la probabilidad de que los puestos sean cubiertos por menos de 2
graduados de universidad?

9. Una pastelería ofrece pasteles con decoración especial para cumpleaños, bodas y otras
ocasiones. También tiene pasteles normales en su tienda. En la tabla que sigue se
proporciona el número total de pasteles vendidos al día y las probabilidades
correspondientes.

Nº de pasteles Probabilidad
vendidos/día
12 0.25
13 0.40
14 0.25
15 0.10

a) Complete la tabla y diga de qué tipo de distribución se trata.


b) Realice una gráfica de la distribución.
c) ¿Cuántos pasteles venderá al día, si tomamos en cuenta la mayor probabilidad?

Distribución de densidad.

10. Dada la siguiente función: f(x) = 3 x2 + 5 x + 4. Para 0 ≤ x ≤ 3

a) Determinar si es o no una función de densidad. Si no es, corregirla.


b) Hallar la probabilidad de que x sea menor que 2.
c) Hallar la función de distribución y graficarla.
d) Hallar todos los estadígrafos de posición y dispersión esperados.
e) Realizar los pasos a) hasta d) para el caso de una distribución discreta para x = 0, 1,
2, 3.

11. Se aplica un examen de 3 horas de duración a todos los candidatos al cargo de


Administrador de Producción en una Empresa líder en el mercado nacional en la
fabricación de sogas y productos plásticos. Se ha descubierto que el tiempo x en horas
necesario para efectuar el examen es aleatorio y tiene la siguiente función de densidad:
f (x) = − x 2 + 10x para 0 ≤ x ≤ 3 .

a) Halle la distribución de densidad.


b) Determine la probabilidad que alguien termine la prueba en 2 horas o en menos
tiempo.
c) Halle los estadígrafos de posición y dispersión esperados.
40
Cálculo de probabilidades en cuadros bidimensionales y arboligramas.

12. Se sabe que el consumo de las personas (y), depende de los ingresos que perciben (x).
Para un grupo de 50 personas, se tiene la siguiente información (cientos de bs.):

Consumo
Ingresos 4 9 15
1- 5 8 7 3
5’ - 11 2 6 9
11’ - 15 0 5 10

a) ¿Cuál es la probabilidad de consumir 15 bs?


b) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre
1100 y 1500 bs. y su consumo sea de 400 bs?
c) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre
1100 y 1500 bs. dado que su consumo sea de 400 bs?
d) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre
1100 y 1500 bs. o su consumo sea de 400 bs?

13. En un programa de entrenamiento para la gerencia de una empresa de cosméticos, 80%


de los asistentes son mujeres y 20% son hombres; 90% de las mujeres son egresadas
de la Universidad y 78% de los hombres También.

a) Se selecciona al azar una de las personas en entrenamiento. ¿Cuál es la probabilidad


de que se trate de una mujer que no asistió a la universidad?
b) Trace un arboligrama que muestre todas las probabilidades normales o marginales,
condicionales y conjuntas.

14. Cada vendedor en una compañía se califica como abajo del promedio, promedio, o
arriba del promedio, con respecto a su habilidad para las ventas. Además cada vendedor
se clasifica con respecto a sus posibilidades de promoción:

Posibilidad de promoción
Habilidad en ventas Regular Buena Excelente
Abajo del promedio 16 12 22
Promedio 45 60 45
Encima del promedio 93 72 135

a) Utilizando una de las reglas para combinar probabilidades, ¿cuál es la probabilidad


de que un vendedor seleccionado al azar tenga habilidad de ventas por encima del
promedio y excelentes posibilidades de promoción?
b) Trace un diagrama de árbol que muestre todas las probabilidades normales,
condicionales y conjuntas.

En los siguientes ejercicios emplee el teorema de Bayes:

15. Un equipo de béisbol juega 70% de sus partidos por la noche y 30% durante el día. El
equipo gana 50% de sus juegos nocturnos y 90% de los diurnos. De acuerdo con el

41
diario del día de hoy ganó ayer. ¿Cuál es la probabilidad de que el partido se haya
desarrollado por la noche?

16. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que 80%
de los estudiantes completan los problemas asignados. Determinó que de los alumnos
que hacen las tareas 90% aprobarán el curso. De aquellos estudiantes que no realizan
la tarea completa solo 60% aprobarán. Miguel Sánchez tomó Estadística el último
semestre con la profesora y tuvo calificación aprobatoria. ¿Cuál es la probabilidad de
que sí haya hecho las tareas?

17. Tan solo el 20 % de las mujeres mayores de 40 años egresadas de la universidad


ejercen su profesión, mientras que un 70% de las egresadas menores de 40 también lo
hacen. La relación de mujeres profesionales mayores de 40 entre las menores de 40 es
de 2 a 6. Francis Morales es Ingeniero Químico y no ejerce su profesión, cual es la
probabilidad de que tenga menos de 40 años.(10 puntos). Dibuje el arboligrama con
todas las probabilidades marginales, condicionales y conjuntas (10 puntos). Realice un
cuadro de contingencias tomando en cuenta que N = 80 y verifique la probabilidad
anterior.

18. Una compañía que fabrica tornillos, tiene 3 fábricas: A, B, C. Las fábricas B y C
producen el mismo número de tornillos, mientras que A produce el doble de las de B.
Por experiencia pasada, se sabe que el 2% de los tornillos producidos por A y B
respectivamente son defectuosos, en tanto que el 4% de los fabricados por C son
defectuosos. Los tornillos producidos por las tres fábricas se guardan en un mismo lugar.

a) Dibuje un arboligrama, con todas las probabilidades.


b) Si se escoge aleatoriamente un tornillo del almacén, ¿Cuál es la probabilidad de que
sea defectuoso?.
c) ¿Cuál es la probabilidad de que el tornillo defectuoso escogido haya sido producido
en la fábrica A?.

19. Un grupo de investigación independiente ha estado estudiando las probabilidades de


que suceda un accidente en una planta de energía nuclear que produzca como
resultado una fuga radiactiva. El grupo considera que los únicos tipos posibles de
accidentes que pueden suceder en un reactor son incendio, falla de material y error
humano, y que dos o más accidentes nunca se presentan juntos. Ha llevado a cabo
estudios que indican que si se desatara un incendio, habría 20% de posibilidades de
que hubiera una fuga de radiación; si hubiese una falla mecánica, habría 50% de
probabilidades de fuga radiactiva, y si se presentara un error humano, se tendría 10%
de posibilidades de fuga. Sus estudios también han mostrado que la probabilidad de:

• Que se presenten juntos un incendio y una fuga de radiación es de 0.0010.


• Que se den juntas una falla mecánica y una fuga de radiación es de 0.0015.
• Que se dé un error humano y haya una fuga de radiación al mismo tiempo es de
0.0012.

a) Cuáles son las probabilidades respectivas de que se presente un incendio, una falla
mecánica y un error humano?
b) Cuáles son las respectivas probabilidades de que una fuga de radiación sea
ocasionada por un incendio, una falla mecánica o por error humano?
42
20. Se realizó un estudio de mercado a nivel nacional para determinar las preferencias de
varios grupos de hombres que tienen diferentes edades, para diferentes deportes. Se
selecciona una muestra aleatoria de 1000 hombres y se les pide que indiquen su
deporte favorito. Los resultados son los siguientes:

< 20

20-40 Información adicional:


BO 40’-50 111
P ( F / 20 − 40) =
>50 0.134 225
P ( F ∪ < 20) = 0.494
< 20
P( > 50) = 0.2
20-40 0.222
0.427
F 0.1733 40’-50

>50

< 20
0.1981
20-40

BA 40’-50

>50

Edad\Deporte Voleibol Fútbol Básquetbol Totales


Hasta 20 26 150
20’ – 40
40’ – 50 96
Mayores a 50
Totales

a) Completar la bidimensional y el árbol de probabilidades.


b) Hallar el porcentaje de los hombres que a lo menos tienen 40’ años y su preferencia
es el básquetbol.
c) ¿Cuál es la probabilidad que a un anciano le guste el básquetbol?

43
EJERCICIOS PROPUESTOS

1. ¿Cuáles de los siguientes pares de eventos son mutuamente excluyentes?

a) Un contratista del departamento de defensa pierde un contrato importante, y el mismo


contratista aumenta su fuerza de trabajo en 50%.
b) Un hombre es de mayor edad que su tío y es menor que sus primos.
c) Un equipo de béisbol pierde su último juego y gana la Serie Mundial.
d) Un gerente de banco descubre que uno de sus cajeros ha estado desfalcando a la
institución y lo promueve.

2. ¿Cuáles de los siguientes pares de eventos son estadísticamente independientes?

a) El número de veces que se utiliza una computadora hasta que ésta falla y una segunda
computadora vendida por una firma distinta.
b) El tiempo de vida del presidente de los Estados Unidos y el tiempo de vida del
presidente de Rusia.
c) La adquisición de una compañía y la elevación del precio de sus acciones.
d) La frecuencia de donación de órganos de una comunidad y las orientaciones religiosas
de esa comunidad.

3. Una persona vende automóviles nuevos para una empresa. Generalmente negocia el
mayor número de autos los sábados. Ha establecido la siguiente distribución de
probabilidad para el número de autos que espera vender un sábado en particular.

N° de autos Probabilidad
vendidos
0 0.10
1 0.20
2 0.30
3 0.30
4 0.10

a) ¿Qué tipo de distribución es ésta?


b) En un sábado común, ¿cuántos autos espera vender?
c) ¿Cuál es la varianza esperada de la distribución?
d) ¿Cuál es la mediana y la moda esperada?

4. Como se sabe, la respuesta a una pregunta de verdadero o falso es correcta o incorrecta.


Considere que un examen está formado por 4 preguntas de este tipo, y un estudiante no
sabe nada sobre el tema.

a) Construya la tabla de distribución de cuantía.


b) ¿Cuál es la probabilidad de que el estudiante responda todas las preguntas mal?
c) ¿Cuál es la probabilidad de que el estudiante responda por lo menos una bien?

44
5. Una florería tiene 15 vehículos de reparto que se utilizan principalmente para llevar flores
y arreglos florales en una ciudad. Supóngase que 6 de los 15 camiones tiene problemas
con los frenos. Se seleccionaron 3 vehículos al azar para probarlos.

a) Construya la distribución de probabilidades para el experimento.


b) ¿Cuál es la probabilidad de que dos de los camiones probados tengan frenos
defectuosos?

6. Suponga que tiene la siguiente función: f(x) = 3 x2 + 2 x +6 para 0 < x < 3.

a) Determine si es función de densidad. Si no lo fuera corríjala. Calcule la probabilidad de


que la variable sea al menos 1 y a lo más 2.
b) Determine la función de distribución de densidad.
c) Halle la media, mediana, moda y varianza de la distribución.
d) Haga lo mismo considerando a la función como una de cuantía, para x = 0, 1, 2, 3.

7. Una encuesta de estudiantes de licenciatura en una universidad reveló lo siguiente en lo


que se refiere al sexo y área principal de interés de los estudiantes:

Área principal de interés


Sexo Contabilidad Administración Finanzas Total
Hombres 100 150 50 300
Mujeres 100 50 50 200
Total 200 200 100 500

a) Trace un diagrama de árbol y determine las probabilidades marginales, condicionales y


conjuntas (Comenzar por el atributo de área principal de interés)
b) ¿Cuál es la probabilidad de seleccionar alguien cuya área de principal interés sea
contabilidad, dado que la persona seleccionada es de sexo masculino?
c) ¿Cuál es la probabilidad de seleccionar una estudiante o alguien con área principal de
interés en contabilidad?

8. Una empresa tiene cuatro proveedores de materia prima. En la tabla que sigue se
muestran las cantidades adquiridas de cada proveedor y el porcentaje de materia prima
defectuosa que cada uno proporciona:

Porcentaje Porcentaje
Proveedor adquirido defectuoso
A) Roberts Inc. 30.0 2.50
B) Almus Mtg. 20.0 1.75
C) Lewis Ltd. 25.0 3.00
D) Melvin Inc. 25.0 1.00

a) Trace un diagrama de árbol y determine las probabilidades marginales, condicionales y


conjuntas.
b) El material empleado esta mañana resultó defectuoso ¿Cuál es la probabilidad de se
haya adquirido en la compañía B?
c) ¿Cuál es la probabilidad de seleccionar un material defectuoso?

45
9. El departamento de crédito de una negociación comercial, informó que 30% de sus ventas
son en efectivo, 30% se pagan con cheque en el momento de la adquisición y 40% son a
crédito. Se tiene que 20% de las compras en efectivo, 90% de los cheques y 60% de las
compras a crédito son por más de 50 $us.

a) Dibuje un diagrama de árbol, mostrando las probabilidades marginales, condicionales y


conjuntas.
b) Usted acaba de comprar un jean nuevo que cuesta 120 $us. ¿Cuál es la probabilidad
de que haya pagado en efectivo?

En los siguientes ejercicios emplee el teorema de Bayes:

10. Con base en la experiencia, se sabe que en cierta industria, el 60% de todas las
discusiones entre los empleados y la gerencia se refieren a los salarios, el 15% es sobre
las condiciones laborales y el 25% acerca de las prestaciones. Así mismo, el 45% de las
discusiones referentes a los salarios se resuelven sin huelgas, el 70% de las discusiones
sobre las condiciones laborales se resuelve sin huelgas y el 40% de las discusiones
acerca de las prestaciones se resuelve sin huelgas. ¿Cuál es la probabilidad de que una
discusión entre los empleados y la gerencia de esta industria se resuelva sin una
huelga?

11. En una planta electrónica, se sabe con base en la experiencia pasada que la
probabilidad de que un empleado nuevo que ha asistido al programa de capacitación de
la compañía cubra su cuota de producción es 0.86, y que la probabilidad
correspondiente para un empleado nuevo que no ha asistido al programa de
capacitación es 0.35. Si 80% de todos los empleados nuevos han asistido al programa
de capacitación, ¿cuál es la probabilidad de que:

a) un empleado nuevo no cubra su cuota de producción.


b) un empleado nuevo que no haya asistido al programa de capacitación de la compañía
no cubra su cuota de producción?

12. En la Papelera S.A. se producen Blocks Líder con y sin espiral (50% de cada tipo), el
60% de cada tipo son rojos, 20% de los blocks sin espiral son azules lo mismo que 25%
de los con espiral, el resto de los Blocks son verdes.

a) Represente al arboligrama, incluyendo las probabilidades normales, condicionales y


conjuntas.
b) Llene el cuadro bidimensional, si se sabe que en el día se produjeron 1000 blocks
Líder, y encuentre la probabilidad de escoger al azar un cuaderno rojo con espiral.

13. Tan solo el 20 % de las mujeres mayores de 40 años egresadas de la universidad


ejercen su profesión, mientras que un 70% de las egresadas menores de 40 también lo
hacen. La relación de mujeres profesionales mayores de 40 entre las menores de 40 es
de 2 a 6. Susana Morales es Ingeniero Químico y no ejerce su profesión, cual es la
probabilidad de que tenga menos de 40 años. Dibuje el arboligrama con todas las
probabilidades marginales, condicionales y conjuntas. Realice un cuadro de
contingencias tomando en cuenta que N = 80 y verifique la probabilidad anterior.

46
14. El siguiente diagrama se refiere al número de unidades defectuosas producidas por
cuatro trabajadores operando tres diferentes máquinas, un día viernes.

35.577 M1

T1 M2 P(T1 , M 2 ) = 7.078 %
23.744
M3
34.234 M1 P(T2 / M1 ) = 26.207 %
T2 M2
P(M1 ) = 33.105 %
M3
31.148 M1 P(M 3 ) = 33.790 %
27.854
T3 M2
P(T3 , M 3 ) = 9.361 %
M3
M1
T4 M2
37.624
M3

a) Determinar la distribución bidimensional, que abarca a 438 unidades defectuosas.


b) ¿Qué porcentaje de las unidades defectuosas fueron producidas por el trabajador 4 o
en la máquina 2?

47
EJERCICIOS PARA EXAMEN

DECISIONES VARIAS USANDO PROBABILIDADES

1. La estatura mínima que deben tener los candidatos que quieren entrar a la selección
nacional de Voley Ball es de 1,7 m. Se ha descubierto que la estatura x en m. de los
candidatos que se han presentado tiene la siguiente función de densidad:

f (x) = x 3 + 5x 2 + 2x + 1 para 1, 7 ≤ x ≤ 2,1

a) Determine la probabilidad que alguien que mide menos de 1,8 m. pueda entrar a la
selección.
b) Determine la probabilidad que tiene una persona que mide entre 1,8 y 2 m. de entrar a
la selección.

2. El docente de Estadística tiene un problema de límite de alumnos en su materia este


semestre. Tiene 40 alumnos y quiere transferir a 3 alumnos a la clase de la tarde. 30
alumnos no pueden asistir a la clase de la tarde por imposibilidad en sus horarios. Para
resolver este asunto, el docente elegirá al azar de los 10 alumnos que no tienen excusa
para la transferencia. Sabe que en ese grupo existen 6 personas repitentes.

a) Presentar la distribución de probabilidades del número de repitentes.


b) En base a la pregunta anterior, responder la siguiente pregunta: ¿Cuál es la
probabilidad de que el docente elija a por lo menos 1 repitente?

3. El consejo directivo de Industrias Sol está formado por ocho hombres y cuatro mujeres.
Se conforma un comité de cuatro elementos escogidos al azar.

a) Se trata de un experimento aleatorio?. Justifique su respuesta. ¿Cuál es la probabilidad


que las 4 sean mujeres?

b) Construya una tabla para la función de cuantía tomando en cuenta que la variable
aleatoria se define como el número de hombres que integran el comité.

4. Un estudiante se presenta a un examen oral, que consiste de 3 preguntas. El profesor


preparó el examen para que el alumno eligiera entre 5 preguntas de distribuciones
discretas de probabilidad, 3 preguntas de distribuciones de frecuencia y 4 de
distribuciones continuas de probabilidad.

a) Hallar la probabilidad que el alumno tenga que contestar al menos una pregunta sobre
distribuciones discretas de probabilidad.
b) Hallar la probabilidad que el alumno tenga que contestar 2 preguntas sobre
distribuciones de frecuencia.

48
CAPÍTULO 2

DISTRIBUCIONES TEÓRICAS DE PROBABILIDAD

1. INTRODUCCIÓN

Las distribuciones de probabilidad que se han determinado en el capítulo 1, se conocen


como funciones empíricas. Las funciones teóricas de probabilidad corresponden a modelos
que permiten expresar teorías sobre el comportamiento ideal de una variable en la realidad.

Una distribución teórica se utiliza para:

• Expresar lo que puede esperarse de un universo, cuando se comporta como deseamos


que lo haga.
• Como fuente de referencia, a fin de comparar con distribuciones observadas.
• Cuando las distribuciones observadas son difíciles de formalizar, se la utiliza para resolver
problemas y efectuar operaciones.
• Sirve para realizar inferencias y elaborar predicciones sobre el comportamiento de una
variable cuando se dispone de información limitada.

Las funciones teóricas de probabilidad correspondientes a variables discretas son:

• Binomial
• Hipergeométrica
• Poisson.
• Multinomial.
• Binomial negativa.

Existen muchas otras más, como la distribución uniforme y la geométrica, pero para el
propósito de este texto solo se incluyen las más importantes.

Si la variable aleatoria es continua y se utiliza el análisis a grandes muestras, su función es:

• La Normal.

En casos de muestras pequeñas se usa:

• t de Student
• Chi-cuadrada
• F de Fisher.

Existen otras funciones continuas de probabilidad, como la uniforme, log-normal, gamma,


Erlang y Weibull, que tienen aplicación en la simulación y las ciencias físicas.

En este capítulo se estudiarán todas las funciones teóricas discretas de probabilidad y solo la
distribución continua Normal, puesto que se requieren nociones de inferencia estadística y
muestreo para estudiar las otras distribuciones mencionadas.
49
2. DISTRIBUCIONES TEÓRICAS DISCRETAS DE PROBABILIDAD

2.1. Introducción

En general, la determinación de un modelo teórico discreto de probabilidades para aplicarlo a


un caso observado, se realiza tomando en cuenta las siguientes características:

• La naturaleza del número de pruebas del experimento (fijo o variable).

• La naturaleza de los resultados del experimento (dicotómico o no).

• El carácter de la probabilidad en cada prueba (constante o variable).

• La determinación del carácter del experimento (Sucesos dependientes o independientes).

2.2. Distribución binomial

Es una distribución de probabilidad discreta, pues los datos recopilados son resultado de
conteos. Se la utiliza como modelo cuando:

• El número de pruebas o ensayos del experimento es fijo: “n”.

• El resultado solo puede tomar una de dos formas, comúnmente denominadas como éxito
y fracaso. Cada resultado es mutuamente excluyente.

• La probabilidad de éxito, “p”, permanece constante de un ensayo a otro y lo mismo


sucede con la de fracaso, “q”; tal que: p + q = 1.

• Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta
al resultado de algún otro. Esta condición puede asegurarse mediante un muestreo con
reposición en poblaciones finitas o el muestreo de poblaciones infinitas o muy grandes.

La distribución probabilística binomial se puede describir utilizando la fórmula:

n
P(x) =   p x q n − x
x
Donde:

n, es el número de ensayos
x, es la variable aleatoria discreta del número de éxitos
p, es la probabilidad de éxito en cada ensayo
q, es la probabilidad de fracaso en cada ensayo, q = 1 - p
n n!
 = es la combinatoria de ‘n’ en ‘x’
 x  x!(n − x)!

La media esperada es: µ = E(x) = np

50
La varianza esperada es: σ2 = V(x) = n p q

El modelo se representa por el símbolo b(n, p, x) donde n y p, son parámetros conocidos.

Nota: La binomial en una distribución sesgada, pero para valores de p cercanos a 0.5 y
n>20, se vuelve prácticamente simétrica.

Los valores de probabilidad de un modelo binomial están tabulados y se presentan en forma


de una distribución acumulada de probabilidades. Estos valores se designan con el signo
B(n, p, x) dispuestas en tablas con el siguiente formato (Ver anexo de tablas al final del
texto):

p
n x 0.1 0.2 0.3 ... 0.5
3 0
1 Valores de probabilidad
acumulada
2

Ejemplo.

En una clínica se han producido tres partos.

a) Calcular la probabilidad de que haya nacido una niña.

b) Calcular la probabilidad de que al menos hayan nacido dos niños.

Resolución:

Primero se verifica si las condiciones del problema que muestran una distribución de
probabilidad, se pueden ajustar al modelo binomial:

• Se efectúa un número de pruebas igual a 3, FIJO.


• Los resultados se clasifican en: "nacer niña, éxito" y "nacer niño, fracaso".
• La probabilidad de éxito en cada prueba es 0.5, constante.
• Las pruebas son independientes, porque habiendo nacido niña en una prueba no quiere
decir que en la anterior y la siguiente prueba nazca también niña.

El experimento, por características anteriores, se puede decir que sigue un modelo


probabilístico binomial. Sus probabilidades se resuelven usando la expresión del modelo
binomial:

n=3
P(x) = 0.5
q(x) = 0.5

a) En este caso la variable "x" representa el número de niñas. Se desea resolver la


probabilidad de que x=1.

51
Entonces:

1 3−1
3 1   1   1  1 
P(x = 1) =      = 3    = 0.375
1 2   2   2  4 

Respuesta: Hay una probabilidad de 37.5% de que en tres partos haya nacido una niña.

b) En este caso la variable "x" representa el número de niños. Probabilidad de nacer 2 o más
niños:

P (x ≥ 2 ) = P (x = 2 ) + P (x = 3 )

2 3− 2 3
 3 1   1  3* 2  1 
P(x = 2) =       =   = 0.375
 2 2   2  1* 2  2 

3 0 3
 3   1   1  3* 2*1  1 
P(x = 3) =      =   = 0.125
 3   2   2  1* 2 *3  2 

Luego: P(x ≥ 2) = 0.5

Respuesta: Hay una probabilidad del 50% de que en tres partos hayan nacido 2 o más niños.

Los resultados anteriores pueden determinarse directamente leyendo en una tabla B(x, n, p)
(tabla binomial de frecuencia acumulada), donde n es el número de pruebas y p, la
probabilidad de elementos.

p
n x 0.1 0.2 0.3 ... 0.5
3 0 0.1250
1 0.5000
2 0.8750
3 1.0000

a) P(x = 1) = P(x ≤ 1) − P(x = 0) = 0.5000 − 0.1250 = 0.3750

b) P(x ≥ 2) = 1 − P(x ≤ 1) = 1 − 0.5000 = 0.5000

Se concluye que la tabla acumulada es muy útil en la resolución de problemas, porque


simplifica los cálculos.

2.3. Distribución hipergeométrica

Es una distribución de probabilidad discreta al igual que la binomial, se utiliza cuando el


tamaño de la muestra es superior al 5% de la población y tiene las siguientes características:

52
• El número de pruebas o ensayos es fijo, “n”.

• El resultado solo puede tomar una de dos formas, comunmente denominadas como éxito
y fracaso. Cada resultado es mutuamente excluyente.

• La probabilidad de éxito no permanece constante de un ensayo a otro, es variable.

• Los ensayos deben ser dependientes. Esto ocurre cuando los ensayos son sin reposición
y en poblaciones finitas o pequeñas.

La fórmula para la distribución probabilística hipergeométrica es:

 N1   N − N1 
  
 x  n − x 
P(x) =
N
n
 
Donde:

N, es el tamaño de la población
N1, es el número total de elementos de la categoría éxito en la población
n, es el número de ensayos o tamaño de la muestra
x, es el valor de la variable aleatoria discreta del número de éxitos

La esperanza matemática es: E(x) = np


 N−n  N1
La varianza esperada es: V(x) = np(1 − p)   , donde: p =
 N −1  N

Ejemplo.

En una canasta existen 7 cítricos: 4 naranjas y 3 limas. Un niño elige 3 cítricos.

a) Qué probabilidad hay de que sean 2 naranjas?


b) Cuál es la probabilidad de que hayan al menos 2 limas?

Resolución.

El problema proporciona la siguiente información:

• El número de pruebas n=3, es fijo.


• El resultado de la prueba se clasifica en:
Éxito es que sean naranjas.
Fracaso es que sean limas.
• La probabilidad de obtener naranjas es diferente en cada prueba, por tanto también es
diferente la probabilidad de obtener limas.
• Las pruebas son dependientes, este resultado se ve afectado por la prueba anterior y
afecta al siguiente.
53
Por lo tanto, la distribución empírica del problema se puede ajustar a un modelo
hipergeométrico.

a) Obtener 2 naranjas.
 4  7 − 4  4 * 3
 2  3 2 
  −  1 * 2 * 3 108
P (x = 2 ) = = = = 0.51
7 7 * 6 * 5 210
  1* 2 * 3
 3

Respuesta: En el 51% de los casos el niño podrá obtener 2 naranjas.

b) Sacar al menos 2 limas.

P (x ≥ 2 ) = P (x = 2 ) + P (x = 3 )

 3  4   3  4  3* 2
      *4
2 1 3 0
P(x ≥ 2) =    +    = 1* 2 1*1 78
+ = = 0.37
 7  7 7 *6 *5 7 * 6*5 210
    1* 2*3 1* 2 *3
 3  3

Respuesta: En el 37% de los casos es posible que el niño haya obtenido al menos 2 limas.

2.4. Distribución de Poisson

También denominada ley de eventos improbables. Se aplica a problemas que cumplen las
características de una distribución binomial con probabilidad de éxito, “p”, pequeña (p<0.05)
y tamaño de muestra, “n”, grande (n>25).

Tiene muchas aplicaciones. Se utiliza como modelo para describir fenómenos como la
distribución de errores en captura de datos, número de imperfecciones en piezas
recientemente pintadas, número de clientes que hacen cola en un banco, número de
llamadas telefónicas, etc.

Matemáticamente puede escribirse utilizando la siguiente fórmula:

µ x e−µ
P(x, µ) =
x!
Donde:

µ es la media (esperanza matemática) del número de ocurrencias (éxitos) en un intervalo de


tiempo dado. En situaciones binomiales µ = np y σ 2 = np , puesto que q ≅ 1.
X es la variable aleatoria discreta del número de éxitos.
e = 2,71828 (la base del logaritmo neperiano).

54
Ejemplo.

Un estudiante de Administración de Empresas, cuando presenta sus informes de


contabilidad, afirma que comete por término medio 5 errores por página. ¿Cuál es la
probabilidad de que cometa al menos 4 errores por página?

Resolución.

Del problema se obtiene la siguiente fórmula:

Número promedio de errores = tamaño de muestra * probabilidad = n * p

• Se supone que el tamaño de la muestra es bastante grande; n = 10000


• El resultado de la prueba es éxito: "error por página" y fracaso: "no tener error por página".
• La probabilidad de éxito es constante en cada prueba y además pequeña.
• Las pruebas son independientes por que cometer un error no influye en que se cometa
otro.

Cuando un experimento aleatorio cumple con las características anteriormente señaladas, su


probabilidad se resuelve aplicando la siguiente expresión:

Se pide: P(x ≥ 4, µ = 5)

Para resolver el problema afortunadamente existen tablas de probabilidad acumulada de


Poisson (Ver anexo de tablas al final del texto):

P(x ≥ 4, µ = 5) = 1 − P(x ≤ 3, µ = 5) = 1 − 0.265 = 0.735

Respuesta: El estudiante tiene la probabilidad de 73.5% de cometer al menos 4 errores por


página.

Nota: se usa indistintamente para la media de ocurrencias en un intervalo de tiempo dado,


tanto λ como µ .

2.5. Distribución multinomial

Un experimento aleatorio se comporta como una distribución multinomial cuando observa las
siguientes características:

• El número de pruebas del experimento es fijo.

• Los resultados del experimento se clasifican en categorías (K).

C1 , C2 , . . . . , CK

• La probabilidad de éxito para cada categoría permanece constante en cada prueba y se


expresa como:
P1 , P2 , . . . . , PK

55
• Las pruebas son independientes, es decir el resultado de una prueba no afecta ni es
afectado por el resultado de la prueba anterior o la siguiente, respectivamente.

La probabilidad del experimento con estas características se calcula mediante la siguiente


expresión:

n!
f ( x1, x 2,..., x K ) = * P ( x1) x1 * P ( x 2) x 2 *...* P ( x K ) x K
x 1!* x 2!*...* x K!
n
n!
f ( x 1, x 2,..., x K ) = n
* Π P ( x i ) xi
Π x!
i=1
i
i=1

Ejemplo.

En una bolsa de mercado existen 7 cítricos: 3 naranjas, 2 limas y 2 toronjas. Un niño elige 3
cítricos con reposición. Determinar la probabilidad de que sean 2 toronjas y una naranja.

Resolución.

El problema proporciona la siguiente información, que indica que la distribución planteada


sigue un modelo multinomial:

• El número de pruebas es 3 y es fijo.


• Los resultados de la prueba se clasifican en 3 categorías:
C1 = toronjas
C2 = naranjas
C3 = limas
• La probabilidad de cada categoría es constante en cada prueba y sus valores son:
P1 = 2/7
P2 = 3/7
P3 = 2/7
• Las pruebas son independientes por que si en la prueba sale 1 toronja y 2 naranjas, esto
no quiere decir que la siguiente o la anterior prueba sea de la misma naturaleza.

Con los datos anteriores, la probabilidad solicitada es:

2 1 0
3! 2 3 2
f (x 1 = 2 , x 2 = 1 , x 3 = 0 ) =      
2!* 1!* 0!  7   7   7 

3 * 2 *1  4  9  72
=    = = 0.105
2 *1  49  49  680

Respuesta: Entonces esta combinación formada por 2 toronjas y 1 naranja, se dará en 10.5
de 100 casos.

56
2.6. Distribución binomial negativa

Un experimento aleatorio se comporta como una DBN cuando:

• El número de pruebas “n”, es variable.

• Los resultados se clasifican en 2 categorías (éxito o fracaso).

• La probabilidad de éxito es constante en cada prueba.

• Las pruebas son independientes.

La probabilidad de los eventos se calcula usando la siguiente expresión.

*  n -1 c n − c
b (n, c, P ) =   P q
 c -1 

donde: n = número de pruebas


c = número de éxitos
P = probabilidad de éxito

Por razones prácticas, la expresión anterior debe transformarse en probabilidad de valores


acumulados y además en función de probabilidades acumuladas de la binomial positiva:

 n -1 c n −c
B (n, c, p ) = ∑ 
*
p q
 c -1 
 n  x n−x
B (n, c, p ) = 1 - ∑   p q
*

x

B* (n, c, p ) = 1 - B (x -1, n, p )

Ejemplo.

Los productores de durazno en Cochabamba han detectado que el 10% de los duraznos
están afectados por la mosca. Supongamos que un grupo de estudiantes van a un huerto de
duraznos con el permiso del propietario y están deseosos de que, eligiendo al azar los
duraznos, puedan comer 20 duraznos buenos. ¿Cuál es la probabilidad de que tengan que
probar 25 o más duraznos (los afectados se descartan).

Resolución.

El problema contiene la siguiente información:

• El número de pruebas es n>25, por tanto es variable.

• Los resultados de la prueba se clasifican en éxito: durazno que no está afectado por la
57
mosca de la fruta; fracaso: durazno afectado.

• Probabilidad de éxito 90% constante en cada prueba.

• Las pruebas son independientes porque si en cualquier prueba un durazno no está


afectado no quiere decir que en la selección anterior o la siguiente tampoco esté afectado.

Por los datos presentados, el experimento corresponde a una binomial negativa.

donde; c = x = número de éxitos = 20


n = mayor que 25 (variable)
P = 0.90 probabilidad de éxito.

b* (25, 20, 0.9) = 1 − (1 − B(19, 25, 0.9)) = 0.967

Respuesta: Hay una probabilidad de 96.7% de que si quieren comer 20 duraznos buenos,
tengan que probar 25 o más duraznos.

3. FUNCIONES TEÓRICAS CONTINUAS DE PROBABILIDAD

3.1. Distribución Normal

a) Generalidades

Una distribución teórica probabilística continua muy importante es la normal.

Las distribuciones probabilísticas de la duración de algunos productos, como acumuladores


o baterías, neumáticos, bombillas o lámparas, tienden a seguir un patrón normal. Lo mismo
sucede con los pesos de los envases de un cereal, la longitud de rollos de papel tapiz y otras
variables que se miden en una escala continua.

Se dice que la función normal es la piedra fundamental de la Estadística. Su función de


densidad está dada por la siguiente expresión:

− ( x −µ ) 2
1
y= e 2 σ2
−∞ ≤ x ≤ ∞
2πσ

b) Características de una distribución normal

1. La curva tiene perfil de campana, y presenta un solo pico en el centro exacto de la


distribución. La media (aritmética), la mediana y la moda de la distribución son iguales y
están en el punto central, de esta forma la mitad del área bajo la curva se encuentra a la
izquierda y la otra mitad a la derecha de la media.

2. La distribución probabilística normal es simétrica con respecto a su media. Si se corta la


curva normal por la mitad verticalmente, las dos mitades serán como imágenes reflejadas
en un espejo.

58
3. La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
Es asintótica.

4. A una distancia de la media aritmética correspondiente a la desviación estándar, se


encuentran sus puntos de inflexión.

50% 50%
Punto de
Punto de
inflexión inflexión
σ σ

-∞ +∞
Me=Mo=µ

c) Familia de distribuciones normales.

Existen tres familias:

a) Distribuciones que presentan la misma media pero distinta desviación


b) Distribuciones que presentan la misma desviación pero distinta media
c) Distribuciones que presentan distinta media y distinta desviación.

d) Áreas bajo la curva normal

Las posiciones indicadas en la escala de x son los límites de los porcentajes indicados en
cada caso:

1. µ ± 1σ => 68.27%
2. µ ± 2σ => 95.45%
3. µ ± 3σ => 99.73%

El área total es obviamente 100% o 1.0.

e) Distribución Normal Estándar

Resultaría imposible proporcionar una tabla de valores de probabilidad normal para cada
distribución, por lo que se recurre a una variable estandarizada o tipificada “z”:

X−µ
z=
σ

donde : X es el valor de cualquier observación específica


µ es la media de la distribución
σ es la desviación estándar de la distribución

59
El valor de z mide la distancia entre un valor específico X y la media, en unidades de
desviación estándar. La media de la distribución normal estándar es 0 y su desviación
estándar 1 (se realizó esta comprobación en el capítulo de estadígrafos de comparación).

Una distribución normal se simboliza como:N(x, µ, σ)

Una distribución normal estándar, como: N(z, 0, 1)

Ejemplo.

Se ha determinado que los jóvenes que asisten a la fiesta de San Juan, beben 25 tazas de
ponche en promedio, con una varianza de 64 tazas2. Si dicha variable se comporta como una
normal:

a) ¿Cuál es la probabilidad de que tomen a lo más, 19 tazas de ponche?.


b) Determine la proporción de estudiantes que toman más de 41 tazas de ponche.
c) Determine la proporción de estudiantes que consumen entre 19 y 31 tazas de ponche.
d) Determine el mínimo y máximo de tazas de ponche que bebería el 80% central de los
estudiantes.

Resolución.

• Se trata de una distribución normal: N(x, µ=25, σ=8).

a) Se debe resolver: P(x ≤ 19)

Gráficamente:

σ=8

19 µ = 25 x

• Se estandariza la variable.

x − µ 19 − 25
P( ≤ ) = P (z ≤ − 0.75 )
σ 8

Gráficamente:

σ=1

- 0.75 µ=0 z

60
• Se lee el resultado en la tabla de distribución normal de cola superior (Ver anexo de tablas
al final del texto):
P(z ≤ −0.75) = 0.2266

Respuesta: La probabilidad de tomarse 19 o menos tazas de ponche es del 23%.

b) Se trata de resolver: P(x ≥ 41)

Gráficamente:

σ=8

µ = 25 41 x

• Se estandariza la variable.

x − µ 41 − 25
P( ≥ ) = P (z ≥ 2 )
σ 8

Gráficamente:

σ=1

µ=0 2 z

• Se lee el resultado en tabla de distribución normal acumulada.

P(z ≥ 2) = 1 − P(z ≤ 2) = 1 − 0.9772 = 0.0228

Resultado: 2% de los invitados toman más de 41 tazas de ponche.

c) Se trata de resolver: P(19 ≤ x ≤ 31)

Gráficamente:

σ=8

19 µ = 25 31 x

61
• Se estandariza la variable.

19 − 25 x − µ 31 − 25
P( ≤ ≤ ) = P (−0.75 ≤ z ≤ 0.75 )
8 σ 8

Gráficamente:

σ=1

-0.75 µ = 0 0.75 z

• Se lee el resultado en tabla de distribución normal.

P(−0.75 ≤ z ≤ 0.75) = P(z ≤ 0.75) − P(z ≤ −0.75) = 0.7734 − 0.2266 = 0.5468

Resultado: El 55% de los invitados a la fiesta de San Juan consumen entre 19 y 31 tazas de
ponche.

d) Se quiere calcular los límites del 80% central: P(x1 ≤ x ≤ x 2 ) = 0.80

Gráficamente:

80% σ=8

X1 µ = 25 X2 x

• Se estandariza la variable.

x1 − 25 x − µ x 2 − 25
P( ≤ ≤ ) = 0.80
8 σ 8

P (z1 < z < z 2 ) = 0.80

Gráficamente:
80%
σ=1

z1 µ=0 z2 z

• Leyendo en tablas de distribución normal, se determinan los límites de z.


62
z0,10 = -1.28 z0,90 = 1.28

Sustituyendo en la variable estandarizada, se pueden hallar los límites:

x1 − 25
−1.28 = x1 = 25 − (1.28) (8) = 14.76
8

x 2 − 25
1.28 = x 2 = 25 + (1.28) (8) = 35.24
8

Respuesta: El 80% central de asistentes a la fiesta, tomarán entre 15 a 35 tazas de ponche.

4. APROXIMACIÓN NORMAL A LA BINOMIAL

Se utiliza cuando np y nq son mayores a 5. Esto quiere decir que el número de ensayos es
mayor a 20 (y por lo tanto ya no se puede usar la tabla de valores acumulados) y la
probabilidad de éxito es cercana a 0.5. En estas condiciones, la distribución binomial se
acerca mucho a la forma de la distribución normal, y es mejor y más fácil calcular las
distintas probabilidades con esta aproximación.

Factor de corrección por continuidad.

Debido a que se está aproximando una distribución discreta a una continua, es necesario un
factor de corrección.

El factor de corrección por continuidad es el valor 0.5 que se resta o se suma, dependiendo
del problema, a un valor seleccionado cuando una distribución probabilística binomial se está
aproximando por medio de una distribución de probabilidad continua.

La variable estandarizada, en este caso se encuentra por medio de la siguiente ecuación, en


la que se usa la media y la desviación estándar de la distribución binomial:

(x ± 0.5) − np
Z=
npq

Ejemplo.

La gerencia de la cadena de pizzerías CAPRI reveló que el 70% de sus nuevos clientes
vuelven en otra ocasión. En una semana en la que 80 nuevos clientes (de primera vez)
cenaron en uno de sus establecimientos, ¿cuál es la probabilidad que:

a) 60 o más regresen en otra ocasión?


b) menos de 40 regresen en otra ocasión?

63
Resolución.

En primer lugar se debe verificar si el modelo que se ajusta al problema es el binomial.

• El número de pruebas es fijo. n=80.


• El resultado es dicotómico. éxito=los clientes vuelven, fracaso=no vuelven.
• Probabilidad de éxito constante. p=0.7
• Los sucesos son independientes. Que una persona vuelva, no está relacionada a la
decisión de otras personas.

Luego, para observar la conveniencia de utilizar la aproximación, se tratará de resolver el


inciso a) del problema con la fórmula binomial.

a) Se pide: P(x ≥ 60)

Esto se podría tratar de resolver de dos maneras:

Primera: P(x ≥ 60) = P(x = 60) + P(x = 61) + K + P(x = 80)

Segunda: P(x ≥ 60) = 1 − P(x ≤ 59) = 1 − [ P(x = 59) + P(x = 58) + K + P(x = 0) ]

En cada caso, se debe resolver 20 ó 60 veces la fórmula binomial, para hallar el resultado.
Se concluye que es mejor realizar la aproximación.

Para realizar la aproximación, primero se debe verificar si se cumple con las dos
condiciones: np y nq sean mayores a 5.

np = 80(0.7) = 56 nq = 80(0.3) = 24

Luego se hallan los valores de la media y la desviación estándar:

µ = np = 80(0.7) = 56 σ = npq = 80(0.7)(0.3) = 4.1

a) Se pide: P(x ≥ 60)

Gráficamente:

σ = 4.1

µ =56 60 x

Se estandariza la variable:

 (x ± 0.5) − µ (60 − 0.5) − 56 


P ≥  = P (z ≥ 0.85 )
 σ 4.1 
64
En este caso se resta 60 – 0.5, para hallar la variable estándar, ya que siempre se tratará de
cubrir un poco más de área, para realizar la corrección por continuidad.

Gráficamente:

σ=1

µ =1 0.85 z

La probabilidad se determina mediante la tabla de normal estándar de cola superior del


anexo.
P(x ≥ 60) = 0.1977

Respuesta: Hay una probabilidad de 19.77% de que de 80 personas que vinieron la primera
vez a la pizzería CAPRI, 60 o más regresen.

b) Se pide: P(x < 40)

Estandarizando:
 (x ± 0.5) − µ (40 + 0.5) − 56 
P ≥  = P (z ≥ −3.78 )
 σ 4.1 

Gráficamente:

40 µ = 56 x
-3.78 µ=1 z

En este caso, para cubrir un poco más del área, se tuvo que sumar 40 + 0.5, para realizar la
corrección por continuidad.

Usando la tabla normal estándar, se halla la probabilidad pedida:

P(x < 40) = 0.00008

Respuesta: La probabilidad de que menos de 40 regresen a CAPRI es del 0.008%.

5. ÁRBOL DE DECISIÓN PARA ELEGIR LA DISTRIBUCIÓN TEÓRICA


ADECUADA EN LA RESOLUCIÓN DE PROBLEMAS

Se muestra un árbol de decisión para ajustar una distribución empírica a un modelo


probabilístico.
65
ÁRBOL DE DECISIÓN PARA ELEGIR LA DISTRIBUCIÓN ADECUADA

PARA LA RESOLUCIÓN DE PROBLEMAS

n>25
p<0.05 Poisson µ x e−µ
P(x, µ) =
independiente x!
Binomial
dicotómico (x ± 0.5) − np
n np>5 Aproximación Z =
P(x) =   p x q n − x nq>5 a la normal npq
x
fijo dependiente  N1   N − N1 
Hipergeométrica   
x n−x 
categoría P(x) =   
N
 
discreta n
n
variable independiente Multinomial n!
f (x1, x2,..., xK ) = n
* Π P (xi )xi
i=1
Πx! i
i=1

continua dicotómico Binomial *


independiente negativa B (n, c, p ) = 1 - B (x -1, n, p )

¿Tipo de
variable?
− ( x −µ )2
¿Número de 1 2 σ2 X −µ
Normal y= e −∞ ≤ x ≤ ∞ z=
ensayos? σ
¿Resultados 2πσ
¿Naturaleza
posibles?
de las
pruebas?

66
EJERCICIOS DE CLASE

Binomial.

1. En un día veraniego muy caluroso, 10% de los trabajadores de producción de una


empresa están ausentes del trabajo. Se van a seleccionar al azar 10 obreros para un
estudio especial a profundidad sobre el ausentismo.

a. ¿Cuál es la variable aleatoria en este problema ?


b. ¿Tal variable es discreta o continua? ¿Por qué?
c. ¿Cuál es la probabilidad de seleccionar al azar 10 nombres de trabajadores y descubrir
que ninguno está ausente?
d. Calcule la media y varianza.
e. Represente la distribución mediante una gráfica.
f. Encuentre la probabilidad acumulada y represéntela en un diagrama.

2. El departamento de mercadeo de una compañía planea realizar una encuesta nacional


para determinar si los consumidores de cereales en hojuelas pueden distinguir uno de sus
productos favoritos, de los otros del mismo tipo. Para probar el cuestionario y el
procedimiento que se van a emplear, se pidió a ocho personas que cooperaran en un
experimento. Se colocan frente a la persona 5 tazones pequeños marcados A, B, C, D y E
con cereal y se le informó que solo uno tenía su producto favorito. Suponga que la
persona no pudo identificar el cereal y sólo conjeturó que estaba en el tazón C.

a. ¿Cuál es la probabilidad de que haya adivinado correctamente?


b. ¿Cuál es la probabilidad de que ninguna de las ocho adivine en forma correcta?
c. Suponga que siete de la ocho identificaron el cereal que más les gustaba. ¿Es
razonable pensar que solo estaban adivinando? Justifique su respuesta.

Hipergeométrica.

3. En Alke se acaba de recibir un embarque de 10 aparatos de TV. Poco después de


recibirlos, el fabricante llamó para informar que por descuido habían enviado tres aparatos
defectuosos. Se decidió probar dos de éstos. ¿Cuál es la probabilidad de que ninguno de
los dos esté defectuoso?.

4. Un profesor tiene un conjunto de 15 preguntas de opción múltiple referente a


distribuciones probabilísticas. Cuatro de estas preguntas se relacionan con la distribución
hipergeométrica. ¿Cuál es la probabilidad que al menos una de estas preguntas sobre la
distribución hipergeométrica aparezca en el examen de cinco preguntas del próximo
lunes?

Poisson.

5. Un productor de semillas híbridas tiene problemas con gusanos barrenadores del maíz.
Una verificación aleatoria de 5.000 mazorcas reveló estos datos: muchas mazorcas no
tenían gusanos. Algunas tenían uno, otras tenían dos, etc. La distribución del número de
barrenadores se aproximó a una Poisson. El productor contó 3.500 gusanos en las 5.000

67
mazorcas. ¿Cuál es la probabilidad que una mazorca seleccionada al azar no contenga
gusanos?

6. Los automovilistas llegan a una salida de una carretera a razón de dos por minuto. La
distribución de llegadas se aproxima a una distribución de Poisson.

a) ¿Cuál es la probabilidad que en un minuto específico no lleguen automóviles?


b) ¿Cuál es la probabilidad que al menos un automóvil llegue durante un minuto
específico?

Multinomial.

7. En una ciudad muy grande, la televisión nacional tiene el 40% de los televidentes el
viernes por la noche, un canal local tiene 20%, la televisión por cable tiene 30% y 10% ve
videograbaciones. ¿Cuál es la probabilidad de que entre siete televidentes seleccionados
al azar en esa ciudad en una noche de viernes, dos estén viendo la televisión nacional,
uno esté viendo el canal local, tres estén viendo televisión por cable y uno esté viendo
una videograbación?

8. Si un dado se tira 5 veces. ¿Cuál es la probabilidad de que los resultados sean un 1, un 2,


y otros tres números?

Binomial negativa.

9. Un estudiante contesta oralmente un test de elección múltiple con cinco respuestas.


Contesta preguntas hasta que responde correctamente cinco. ¿Cuál es la probabilidad de
que las responda en 25 preguntas o menos, si responde a cada pregunta sin pensar?

10. Se estima que el 90% de un cosecha de papas es buena, estando podridas por dentro
las restantes, pero no puede descubrirse a menos que las papas se corten por la mitad.

a) ¿Cuál es la probabilidad de obtener 20 o menos papas buenas en un saco de 25?


b) Supóngase que el cocinero necesita 20 papas buenas para una comida, para lo que
elige papas al azar, las corta por la mitad y tira las malas. ¿Cuál es la probabilidad de
que tenga que partir más de 25 papas?

Normal.

11. A los empleados de una empresa les otorgan puntuaciones por eficiencia. La distribución
de estas sigue aproximadamente una distribución normal. La media es 400, y la
desviación estándar, 50.

a) ¿Cuánto vale el área bajo la curva normal entre 400 y 482?


b) ¿Cuáles son los límites del 80% de la distribución? (de los valores centrales).

12. Supóngase que un fabricante de neumáticos desea fijar una garantía de millas
recorridas para su nuevo neumático MX100. Las pruebas de duración revelaron que la
media de millas recorridas es de 47.900 , y la desviación estándar es de 2.050 millas. El
fabricante desea fijar la garantía de manera que no tenga que reemplazar mas del 5%
de los neumáticos.
68
a) ¿Cuál es este valor en millas?
b) ¿Cuál es la probabilidad de que los neumáticos duren mas de 50.000 mi.?

Aproximación normal a la binomial.

13. Se estima que 0.5% de las llamadas telefónicas a la Boliviana de Seguros reciben señal
de ocupado. ¿Cuál es la probabilidad que de las 1.200 llamadas telefónicas del día de
hoy, al menos 5 hayan recibido la señal de ocupado?

14. Un estudio realizado por una compañía aseguradora reveló que los propietarios no
recuperaron los bienes robados en 80% de los robos informados a la aseguradora.

a) Durante un cierto período ocurrieron 200 robos. ¿Cuál es la probabilidad de que no


se recuperen los bienes en 170 o más de los asaltos?
b) ¿Cuál es la probabilidad de que ninguno de los bienes robados se recobre en 150 o
más de los asaltos?

69
EJERCICIOS PROPUESTOS

1. Un director de control de calidad de una compañía de automóviles, se encuentra


realizando su revisión mensual de transmisiones automáticas. En el procedimiento, se
retiran 10 transmisiones de la pila de componentes y se les revisa en busca de defectos
de fabricación. A lo largo del tiempo, solo el 2% de las transmisiones tiene defectos
(suponga que los defectos se presentan de manera independiente en diferentes
transmisiones).

a) ¿Cuál es la probabilidad de que la muestra del director contenga más de dos


transmisiones con defectos de fábrica?
b) ¿Cuál es la probabilidad de que ninguna de las transmisiones elegidas tenga defectos
de fábrica?

2. Usted está a cargo de la sección de electrónica de una gran tienda departamental. Se ha


dado cuenta de que la probabilidad de que un cliente que solamente se encuentre
curioseando compre algo es de 0.3. Suponga que 15 clientes visitan la sección de
electrónica cada hora.

a) ¿Cuál es la probabilidad de que al menos una de las personas que curiosea compre
algo durante una hora dada?
b) ¿Cuál es la probabilidad de que al menos 4 personas que curiosean compren algo en
una hora dada?
c) ¿Cuál es la probabilidad de que ninguna de las personas que curiosean compren algo
en una hora dada?
d) ¿Cuál es la probabilidad de que no más de 4 personas que curiosean compren algo en
una hora dada?

3. Un supervisor de producción de una planta de una compañía, está preocupado por la


habilidad de un empleado ya mayor para mantener el menor ritmo de trabajo. Además de
los descansos diarios obligatorios, este empleado deja de trabajar durante períodos cortos
un promedio de 4.1 veces por hora. El período de descanso que se toma es de tres
minutos cada vez. El supervisor ha decidido que si la probabilidad de que el descanso
adicional, 12 minutos o más por hora, del empleado (es decir, además del obligatorio), es
mayor que 0.5, entonces lo cambiará a una tarea diferente. ¿Deberá hacer esto?

4. Un ingeniero de control de calidad quiere comprobar (de acuerdo con las


especificaciones) si el 95% de los componentes electrónicos embarcados por su
compañía están en perfectas condiciones de funcionamiento. Para tal efecto se
seleccionan aleatoriamente 15 componentes de cada lote listo para ser embarcado y se
aprueba su salida si todos están en perfectas condiciones de funcionamiento; de lo
contrario, todos los componentes del lote son revisados. Encuéntrese las probabilidades
de que el ingeniero de control de calidad cometa el error de

a) mantener un lote para revisión adicional a pesar de que el 95% de los componentes
están en perfectas condiciones de funcionamiento;
b) aprobar la salida de un lote completo sin revisión adicional a pesar de que solamente el
90% de los componentes están en perfectas condiciones de funcionamiento;

70
c) aprobar la salida de un lote completo sin revisión adicional a pesar de que solamente el
80% de los componentes están en perfectas condiciones de funcionamiento.

5. Un ingeniero de control de calidad inspecciona una muestra aleatoria de 3 acumuladores


de cada lote de 20 que están listos para ser embarcados. Si un lote contiene 6
acumuladores con pequeños defectos, ¿cuáles son las probabilidades de que la muestra
del inspector contenga

a) ninguna de las baterías con defectos;


b) solamente una de las baterías defectuosas;
c) al menos dos de las baterías con defectos leves?

6. Las probabilidades de que conduciendo cierto sedán de dos puertas en la ciudad se


obtenga un rendimiento promedio de menos de 20 millas por galón de combustible, de 20
a 25 millas por galón o más de 25 millas por galón con 0.3, 0.6 y 0.1, respectivamente.
Obtenga la probabilidad de que entre 6 automóviles de ese tipo sometidos a prueba, dos
promedien como mínimo 20 millas por galón, tres promedien de 20 a 25 millas por galón y
uno promedie más de 25 millas por galón.

7. En una gran universidad se ha determinado que el 20% vive en residencias, el 30% en la


universidad y el 50% en casas particulares. Si se elige un comité de 5 estudiantes,
eligiéndose cada uno independientemente de los demás

a) ¿Cuál es la probabilidad de que el comité esté formado por un estudiante que viva en
la universidad, por uno que viva en una casa particular y por tres que vivan en
residencias?
b) ¿Cuál es la probabilidad de que esté formado por tres o más estudiantes que vivan en
residencias?

8. Un fabricante de proyectiles dirigidos sostiene que sus proyectiles son eficaces en un


90%. La fuerza aérea comprueba las existencias realizando disparos, siendo necesarias
11 pruebas para obtener cuatro éxitos. ¿Cuál es la probabilidad de que se necesiten 11 o
más pruebas si p = 0.9 . ¿Qué conclusión es razonable sacar?

9. Un conocido jugador de béisbol tiene un tiempo medio de bateo de 0.3. Necesita 32 éxitos
más para aumentar su tiempo medio a 3.0. ¿Cuál es la probabilidad de que necesite
batear 100 o menos veces para conseguir su propósito?

10. Una compañía ha recibido un gran pedido para producir motores eléctricos para una
compañía manufacturera. Con el fin de que ajuste en su soporte, el rotor del motor debe
tener un diámetro de 5.1 ± 0.05 (pulgadas). El encargado de compras de la compañía se
da cuenta de que hay en existencia una gran cantidad de varillas de acero con un
diámetro medio de 5.07 plg., y con una desviación estándar de 0.07 pulg. ¿Cuál es la
probabilidad de que una varilla de acero del inventario se ajuste en el soporte?

11. Ciertos bastoncillos de plástico moldeados por inyección son cortados automáticamente
en longitudes nominales de 6 pulgadas. Las longitudes reales están distribuidas
normalmente alrededor de la media de 6 pulgadas y sus desviaciones estándar son 0.06
pulgadas.

71
a) ¿Qué proporción de los bastoncillos rebasan los límites de tolerancia, que son de 5.9 a
6.1 pulgadas?
b) ¿A qué valor es necesario reducir la desviación estándar si 99% de los bastoncillos
debe estar dentro de los límites de tolerancia?

12. La compañía Quickie Sales acaba de recibir dos estimaciones de ventas que se
consideran conflictivas para el trimestre que se avecina. La estimación I dice que las
ventas (en millones de dólares) están normalmente distribuidas con µ = 325 y σ = 60. La
estimación II dice que las ventas estarán normalmente distribuidas con µ = 300 y σ = 50.
La junta de directores encuentra que cada estimación parece, a priori, ser igualmente
fidedigna. Con el fin de determinar cuál estimación deberá utilizarse para hacer
predicciones, la junta de directores ha decidido reunirse de nuevo al final del trimestre y
utilizar información actualizada sobre las ventas para tomar una determinación sobre la
credibilidad de cada estimación.

a) Suponiendo que la estimación I es precisa, ¿cuál es la probabilidad de que la


compañía tenga ventas trimestrales mayores a 350000000 $?
b) Rehaga el inciso anterior suponiendo que la estimación II es la correcta.
c) Al final del trimestre, la junta de directores encuentra que la compañía tiene ventas
mayores a 350000000 $. Dada esta información actualizada, ¿cuál es la probabilidad
de que originalmente la estimación I haya sido la correcta? (Sugerencia: recuerde el
teorema de Bayes).

13. Un estudio realizado por una compañía aseguradora reveló que los propietarios no
recuperaron los bienes robados en 80% de los robos informados a la aseguradora.

a) Durante un cierto período ocurrieron 200 robos. ¿Cuál es la probabilidad de que no


se recuperen los bienes en 170 o más de los asaltos?

b) ¿Cuál es la probabilidad de que ninguno de los bienes robados se recobre en 150 o


más de los asaltos?

14. La probabilidad de que un componente electrónico falle en menos de 1000 horas de uso
continuo es 0.25. Utilícese la aproximación normal para encontrar la probabilidad de que
entre 200 de tales componentes menos de 45 fallen en menos de 1000 horas de uso
continuo.

15. El estadio Félix Capriles tiene cuatro torres de luz con 25 reflectores de alta intensidad
montados en cada una de ellas. En ocasiones, una torre completa se queda a oscuras.
Daniel Torres, jefe de mantenimiento del estadio, se pregunta qué distribución tendrán
los fallos en las torres de luz. El sabe que cualquier torre individual tiene una
probabilidad de 0.11 de fallar durante un juego de fútbol dado y que las torres son
independientes entre si.

Construya una gráfica, que muestre las probabilidades de que exactamente 1, 2, 3 0 4


torres se queden a oscuras durante el mismo juego.

72
16. Daniel Torres sabe que la probabilidad de que cualquiera de los 25 reflectores de una
torre de luz falle durante un juego dado de fútbol es de 0.05. Los sistemas eléctricos de
la torre han sido modificados de modo que ya no es posible que falle una torre completa.

a) Utilizando las aproximaciones Binomial y de Poisson, determine la probabilidad de


que siete reflectores de una torre dada fallen durante el mismo juego.
b) Utilizando ambos métodos, determine la probabilidad de que dos reflectores fallen.

17. Se estima que el 90% de un cosecha de papas es buena, estando podridas por dentro
las restantes, pero no puede descubrirse a menos que las papas se corten por la mitad.

a) ¿Cuál es la probabilidad de obtener 20 o menos papas buenas en un saco de 25?


b) Supóngase que el cocinero necesita 20 papas buenas para una comida, para lo que
elige papas al azar, las corta por la mitad y tira las malas. ¿Cuál es la probabilidad de
que tenga que partir más de 25 papas?

18. Un embarque de 200 alarmas contra robo, contiene dos piezas defectuosas. Se
seleccionan al azar 5 alarmas contra robo para enviarlas a un cliente.

a) Halle la probabilidad de que el cliente reciba exactamente una alarma contra robo
defectuosa.
b) Halle la probabilidad de que el cliente reciba exactamente una alarma contra robo
defectuosa, si se supone que el embarque es lo suficientemente grande como para
considerarla una población infinita.

19. Una florería necesita 12 helechos exóticos plantados para una exposición floral que se
celebrará en seis meses. Sabe que la probabilidad de que un helecho plantado ahora
sea ideal para la exposición dentro de seis meses es de 0.7. Está interesado en conocer
el número mínimo de helechos que debería plantar, si quiere que la probabilidad de
tener 12 helechos apropiados en seis meses sea por lo menos 0.9.

a) ¿Serán suficientes 15? Obtenga la probabilidad de que si planta 15 helechos, tenga


como mínimo 12 plantas ideales.
b) ¿Serán suficientes 20? Obtenga la probabilidad de que si planta 20 helechos, tenga
como mínimo 12 plantas ideales.
c) ¿Serán suficientes 30? Obtenga la probabilidad de que si planta 20 helechos, tenga
como mínimo 12 plantas ideales.

20. En una ciudad determinada, 4% de los conductores con licencia se verán involucrados
por lo menos en un accidente automovilístico en cualquier año de referencia. Determinar
la probabilidad de que entre 150 conductores con licencia seleccionados al azar en esta
ciudad,

a) Sólo 5 se vean involucrados por lo menos en un accidente, en cualquier año de


referencia.
b) como máximo tres se vean involucrados por lo menos en un accidente en cualquier
año de referencia.

21. Una máquina troqueladora produce tapas de latas cuyos diámetros tienen una
desviación de 0.01 pulgadas. ¿En qué diámetro nominal promedio debe ajustarse la
73
máquina, de tal manera que no más del 5% de las tapas producidas tengan diámetros
que excedan las 3 pulgadas?

22. La experiencia de una empresa química al aplicar una prueba a universitarios recién
egresados que han solicitado trabajos, reveló que la puntuación media de prueba fue de
500, y una desviación estándar de 50.

Con base en esta experiencia, la dirección está considerando aceptar a una persona
cuya puntuación sea 6% superior de la distribución y contratarla directamente para un
puesto de responsabilidad.

a) ¿Cuál es la puntuación más baja que debe tener un egresado universitario para
calificar para un puesto de responsabilidad?
b) Con base en el desempeño anterior, el director de personal planea no tomar en
cuenta a las personas que tengan puntaciones de 400 o menos en la prueba.
Aproximadamente, ¿qué porcentaje de los solicitantes no se tomará en cuenta?
c) Debido al número limitado de vacantes este año, los solicitantes con puntuaciones
entre 400 y 485 se pondrán en espera o reserva. ¿Qué porcentaje de los solicitantes
quedará en espera? Si solicitaron trabajo en la empresa un total de 500 estudiantes,
¿cuántos quedarán en la clasificación de espera?

74
EJERCICIOS PARA EXAMEN

DECISIONES EN LA GERENCIA DE RECURSOS HUMANOS


DE UN BANCO

Usted es el nuevo gerente de Recursos Humanos de un banco. Cada día tiene que resolver
múltiples problemas y realizar muchas decisiones que afectan a la empresa. Para ello el
banco ha montado un departamento de Estadística, ya que anteriormente se hacían
decisiones que no estaban basadas en métodos técnicos, sino en la experiencia del anterior
gerente.

1. El primer problema es decidir una contratación en el área de recursos humanos. Existen


13 candidatos que pasaron la selección de curriculums para el puesto de analista
financiero. Luego de esta primera ronda, se someterá a los candidatos a 5 exámenes: test
psicológico, de coeficiente intelectual, de aptitudes, de conocimientos sobre finanzas y un
test de cómo resolver situaciones conflictivas. Sólo pasarán a la tercera ronda, los
profesionales que aprueben los 5 exámenes. El departamento de estadística manifiesta
que existe una probabilidad del 32% que una persona apruebe los 5 exámenes. Si la
probabilidad de que a lo más 4 de los 13, aprueben los 5 exámenes es menor a 50%,
entonces se tendrá que planificar una metodología para la selección en la tercera ronda,
la cual será realizada por el gerente de recursos humanos, pero si no, se elegirá en base
al criterio que usted tenga de los candidatos luego de una entrevista informal.

a) ¿El gerente de recursos humanos tendrá que planificar una metodología para la tercera
ronda para la contratación?
b) Una vez que alguno de los postulantes sea elegido, éste tendrá que pasar por un
periodo de prueba, que generalmente dura tres meses, donde deberá resolver varios
problemas financieros de la empresa que sucedieron en años anteriores. Así que usted
configuró varios casos históricos para evaluarlo. El nuevo analista financiero resolvió
satisfactoriamente 3 casos en este periodo. La probabilidad de que resuelva
satisfactoriamente un caso (en base a su currículum y a los exámenes aplicados) era
del 80%. ¿Cuál es la probabilidad de que haya resuelto los tres casos
satisfactoriamente, en 5 casos o menos que usted le otorgó? Si esta probabilidad es
mayor a 70%, el analista quedará contratado definitivamente. ¿Será contratado o no?

2. El segundo problema es con respecto al tiempo de espera de los clientes, cuando tienen
que realizar alguna transacción en las cajas del banco. Usted oye cada día un promedio
de 5 quejas, que dicen que los clientes esperan para ser atendidos más de media hora.
Usted, debe tomar la determinación de contratar a un nuevo cajero que aminore este
tiempo de espera y abrir una caja más en el banco. Si la probabilidad de que en un día
específico 5 o más personas se quejen es mayor a 40%, entonces se procederá a realizar
un proceso de selección para el puesto de cajero.

a) ¿Qué deberá hacer?


b) Según datos de la empresa, del total de clientes que vienen a realizar alguna
transacción, el 10% cobran cheques, el 30% realiza un depósito, 40% retira dinero y
20% realiza movimientos a otras cuentas. El día lunes, de 8:00 a 8:30, vinieron 15
personas a la caja n° 1 del banco, especializada en depósitos y retiro de dinero, de las
75
cuales 1 cobró un cheque, 3 retiraron dinero de sus cuentas, 10 realizaron un depósito
y otro hizo un movimiento a otra cuenta. Si la probabilidad de esta mezcla es del 0.5%
o mayor, la caja seguirá manteniendo su especialización, caso contrario se quitará el
letrero de especialización. ¿Cuál es su decisión?

3. El tercer problema es el siguiente: Se cree que el promedio de cuentas en el banco ha


disminuido considerablemente. Datos estadísticos manifiestan que en el último año, la
probabilidad de que una persona cierre su cuenta es del 40%. Usted seleccionó 200
cuentas al azar, para ver cuáles habían sido cerradas o no este mes. Si la probabilidad de
que halle entre 60 a 70 cuentas cerradas es del 20%, usted aprobará una campaña de
publicidad agresiva que será realizada por el departamento de marketing del banco. Caso
contrario, esta disminución se atribuirá a una situación manejable, que no debe preocupar
y por lo tanto se desecha la hipótesis anterior.

a) ¿Se realizará una campaña de publicidad?


b) ¿Cuál es la probabilidad de que de 20 personas que vengan al banco, más de 7 cierren
sus cuentas?

4. Cuarto problema: También se cree que el promedio de dinero en las cuentas disminuyó
considerablemente. Para comprobar esta hipótesis, usted pidió al departamento de
estadística que haga dos análisis: uno pesimista y el otro optimista. El primero tiene una
probabilidad de ajustarse a la realidad de 40%. Tomando el análisis pesimista, se calculó
un promedio de cuenta de 5000 $us., con una desviación de 230 $us. Bajo el otro análisis,
el promedio de cuenta fue de 6500 $us., con una desviación de 420 $us.

a) ¿Cuál es la probabilidad de que tomando un análisis pesimista, el grupo de clientes del


próximo mes en promedio, abran sus cuentas con más de 5500 $us. cada una?
b) ¿Cuál es la probabilidad de que tomando un análisis optimista, el grupo de clientes del
próximo mes en promedio, abran sus cuentas con más de 5500 $us. cada una?
c) El mes pasó y se constató que el grupo de clientes abrieron sus cuentas con menos de
5500 $us. en promedio cada uno. ¿Cuál es la probabilidad de que el análisis pesimista
haya sido el que se ajustó más a la realidad?
d) Si el análisis pesimista se ajustó mejor a la realidad, entonces usted promoverá a
través del departamento de marketing y finanzas, planes de incentivo a los clientes que
tienen más de 5500 $us. en sus cuentas. ¿Cuál es su decisión?

76
PARTE II

MUESTREO

CONCEPTO

Es la base para la realización de métodos de inferencia estadística y consiste en


seleccionar algunos elementos de la población en base a criterios probabilísticos o no, de
manera que la información recogida de ellos, permitan conocer alguna característica de
interés de la población, de manera confiable y representativa, ahorrándose tiempo, dinero y
esfuerzo.

APLICACIÓN

El uso del muestreo no tiene límite. Desde la persona que elige unos cuantos panes en la
tienda para decidir si están duros o son hechos en el día, para comprar la cantidad usual
para su familia, hasta el gerente de producción que tiene que decidir si realizar
mantenimiento a una máquina porque se cree que está produciendo bienes fuera de los
estándares.

77
CAPÍTULO 3

MÉTODOS Y DISTRIBUCIONES DE MUESTREO

1. INTRODUCCIÓN

El muestreo estadístico es un enfoque sistemático para seleccionar unos cuantos


elementos representativos (una muestra) de un grupo de datos, a fin de hacer algunas
inferencias sobre el grupo total (población). Como esta muestra aporta datos bastantes
confiables, no es necesario seleccionar el total.

1.1. Razones del muestreo

1. Naturaleza destructiva de ciertas pruebas.

Probar si un producto reúne las condiciones íntegramente, a menudo lo destruye. Ejemplo:


un experto en alimentos solo prueba poco de queso para deducir el sabor de todo el trozo;
una compañía productora de semillas solo prueba la germinación de unas cuantas.

2. Imposibilidad física de revisar toda la población.

Ejemplo: Si se necesita redactar un informe para describir a todos los empleados que han
renunciado a su compañía durante los últimos 10 años, constituirán cientos de personas,
muchas de ellas no accesibles: habrán muerto, trasladado a otro país, cambiado de
apellido, etc. Entonces lo que se hace es localizar a una muestra representativa y se
generaliza.

3. El costo de estudiar a toda la población es muy alto.

A menudo para recopilar datos de alguna característica de la población se necesitan


encuestadores, entrenamiento, gastos de escritorio, viáticos, sueldos, etc. Por supuesto, el
costo de recopilación de datos de la muestra es mucho menor que para la población.

4. Los resultados de la muestra son bastante fiables.

La pregunta es: ¿Por qué obtener resultados de toda la población si los de la muestra son
bastante confiables?

5. Se necesita mucho tiempo para muestrear a toda la población.

Ejemplo: A menudo los gerentes o jefes de producción necesitan información rápida con
objeto de ajustar una operación o modificar una política. Si hablamos de una máquina
automática, ¿por qué esperar la producción de un día para ver si está funcionando bien? Es
mejor tomar una muestra del producto y verificar su hechura, y si presenta defectos, ajustar
la máquina inmediatamente.

78
1.2. Estadísticos y parámetros

Para describir muestras y poblaciones, se hace la siguiente distinción:

Un estadístico es una característica de la muestra. Se usa letras minúsculas para los


estadísticos:
• n, tamaño de la muestra.
• x , media de la muestra
• s, desviación estándar de la muestra

Un parámetro es una característica de la población. Se los representa mediante letras


mayúsculas o griegas:
• N, tamaño de la población
• µ, media de la población
• σ, desviación estándar de la población

Ejemplo.

La nota promedio de todos los alumnos de la UPB en un semestre específico, es un


parámetro.

La nota promedio de los alumnos de Estadística II en un semestre específico es un


estadístico.

2. TIPOS DE MUESTREO

Hay dos tipos para seleccionar las muestras que provienen de poblaciones:

Probabilístico o aleatorio, cuando la muestra se selecciona de modo que cada integrante


de la población tenga una probabilidad conocida de ser incluido en la muestra.

No probabilístico o de juicio, cuando no todos los integrantes tienen alguna probabilidad


de ser incluidos en la muestra. Se usa el conocimiento y la opinión personal para identificar
los elementos de una población que se van a incluir en la muestra.

Generalmente, sirve de muestreo piloto antes de seleccionar una muestra aleatoria, a fin de
recopilar información útil para determinar el tamaño de la muestra. Su ventaja radica en el
ahorro de realizar un análisis estadístico para tomar las muestras. Su principal desventaja
es que los resultados pueden estar sesgados y no ser representativos de la población.

Ejemplo.

El gerente de una empresa quiere formar un equipo de trabajo para solucionar las bajas en
las ventas del mes pasado. Para ello posee 4 expertos en el área de marketing con igual
entrenamiento y habilidades.

79
Muestreo probabilístico: Selecciona a dos de ellos, mediante bolos numerados del 1 al 4.
Los que sacaron los números 1 y 2, son los que conformarán el equipo.

Muestreo no probabilístico: Selecciona a dedo a dos de ellos para que conformen el equipo.

3. MÉTODOS DE MUESTREO ALEATORIO

Los métodos de muestreo aleatorio tienen el objetivo de permitir que el azar determine los
integrantes de la muestra. Son:

3.1. Muestreo aleatorio simple (MAS)

En el MAS, se seleccionan las muestras mediante métodos que permiten a cada muestra
tener igual probabilidad de ser seleccionada y a cada elemento de la población tener igual
probabilidad de quedar incluido en la muestra. Para este fin se utilizan las tablas de
números aleatorios, que han sido generadas por un proceso aleatorio, en la cual para cada
dígito de un número, la probabilidad de que tenga el valor de 0,1,2,3, ... o 9 es la misma y la
probabilidad de que ocurra una secuencia de dígitos es idéntica a la de cualquier otra
secuencia con la misma extensión. Una tabla de números aleatorios se muestra en el anexo
de tablas estadísticas al final del texto.

Ejemplo.

Una población está constituida por cuatro estudiantes. Se toman muestras de tamaño dos
para una entrevista. Verificar las probabilidades de elegir cada muestra y elegir cada
estudiante en la muestra.

Resolución.

Se nombrará a los estudiantes como: A, B, C y D.

Hay seis muestras posibles de tamaño dos. Esto se comprueba por el análisis combinatorio:

4!
C (4, 2) = =6
(4 − 2)!2!

Las seis muestran tienen la siguiente composición. Esto se realiza por medio de un
diagrama de árbol:

B AB
A C AC
AD
D
C BC
B BD
D

C D CD

80
Cada muestra tiene la probabilidad de 1
6 ó 16.67% de ser elegida si lo hacemos mediante el
MAS.

La probabilidad de que el estudiante A sea elegido es de:

1 1 1 1
P ( A) = P ( AB ) + P ( AC ) + P ( AD ) = + + =
6 6 6 2

puesto que está presente en tres de las seis muestras.

Lo mismo ocurre con los demás estudiantes.

Así que se comprueba que cada estudiante tiene la misma probabilidad de ser incluido en la
muestra y cada muestra tiene la misma probabilidad de ser seleccionada.

3.2. Muestreo sistemático

Se usa cuando el procedimiento del MAS puede ser difícil de usar en algunos casos, sea
por tiempo o dinero.

Difiere del MAS en que cada elemento tiene igual probabilidad de ser seleccionado, pero
cada muestra no tiene esa misma posibilidad. En este muestreo se seleccionan los
elementos de la población con un intervalo uniforme en el tiempo, en el orden o en el
espacio.

Ejemplo.

La población de interés son 2000 facturas colocadas en gavetas de archivos. Primero se


necesitará numerar las facturas de 0000 a 1999. Luego tendrán que seleccionarse 100
facturas (el tamaño de la muestra). Por último habrá que localizar las facturas que forman
parte de la muestra. Esta sería una tarea muy prolongada.

Resolución.

Se selecciona una factura de cada veinte de las que se encuentran en el archivo. La


primera factura se elegirá utilizando un proceso al azar. Si se selecciona la factura número
10, entonces la muestra será de: 10, 30, 50, 70, 80, 90, etc.

Desventaja.

Este muestreo no se puede usar si hay un patrón determinado o secuencial en la población.


Ejemplo: Si se quiere muestrear la basura de papel producida por las familias de una cierta
población y se toman 100 familias los días lunes, existe la probabilidad de que la muestra
sea sesgada, porque la basura incluirá el periódico dominical.

3.3. Muestreo estratificado

81
Para aplicarlo se divide la población en grupos homogéneos relativos, llamados estratos.
Después se recurre a uno de dos métodos posibles:

• Seleccionar al azar en cada estrato un número especificado de elementos


correspondientes a la proporción del estrato de la población total.
• Extraer un número igual de elementos de cada estrato y ponderar los resultados de
acuerdo con la proporción del estrato en la población total.

Ventaja.

El muestreo estratificado garantiza que todos los elementos de la población tengan una
posibilidad de ser seleccionados. Es adecuado cuando la población ya está dividida en
grupos de diferentes tamaños. Cuando se diseñan bien, reflejan más exactamente las
características de la población de donde se extrajeron que otras clases de muestreo.

Ejemplo.

Una empresa quiere saber cuántos productos consumen los clientes por mes y se sabe que
por sus características el consumo depende de la edad.

Resolución.

La empresa, para obtener datos confiables deberá realizar el muestreo estratificado y no el


MAS, ya que la población está dividida por el estrato de la edad.

La empresa tiene que tomar un tamaño de muestra aleatoria de cada grupo de edad, de
acuerdo a los porcentajes de la población que se encuentran en ellos.

Grupo de Porcentaje del Tamaño de


edad total muestra
0-20 30 84
20’-40 40 112
40’-60 20 56
60’-80 10 28

Si la muestra total es de 280, entonces de cada grupo tendrá los tamaños de muestras que
se muestran el la última columna de la tabla anterior.

3.4. Muestreo por conglomerados

Para aplicarlo dividimos la población en grupos o conglomerados y luego seleccionamos


una muestra aleatoria de ellos. Se supone que esos conglomerados son representativos de
la población.

Ejemplo.

Se quiere averiguar el número de televisores por familia en una ciudad.

82
Resolución.

Se utiliza un mapa y se divide la ciudad en manzanas. Luego se selecciona cierto número


de ellas aleatoriamente para realizar la encuesta. Cada familia de dichas manzanas será
entrevistada.

3.5. Diferencias entre el muestreo estratificado y el de por conglomerados

Tanto en el muestreo estratificado como en el de por conglomerados, la población está


dividida en grupos definidos, pero existen las siguientes diferencias:

• Se usa el estratificado, cuando cada grupo presenta una pequeña variación en su


interior, pero existe una amplia variación entre ellos (La intervarianza es mayor que la
intravarianza).
• Se usa el de por conglomerados en el caso contrario: cuando se advierte considerable
variación dentro de cada grupo, pero los grupos son esencialmente semejantes entre sí
(La intravarianza es mayor que la intervarianza).

4. DISTRIBUCIONES DE MUESTREO

La distribución de probabilidad de todas las medias posibles de las muestras es una


distribución de medias muestrales. A esto, los estadísticos la llaman distribución muestral de
la media.

El error estándar es la desviación estándar de la distribución de la medias muestrales, que


mide el grado en que esperamos que las medias de las diferentes muestras varíen por el
error accidental en el proceso de muestreo.

Ejemplo.

Se quiere conocer la vida media de unos focos producidos por cierta fábrica. Para ello se
extrae una serie de muestras y se calcula la vida media de cada foco en cada una de ellas.
Es poco probable que todas las medias muestrales sea iguales, sino que cabe esperar ver
alguna variabilidad en las medias observadas. Dicha variabilidad en el estadístico muestral
resulta del error por muestreo debido al azar. Existen diferencias entre cada muestra y la
población, lo mismo que entre las varias muestras tomadas.

A continuación se explicará mejor este proceso:

a) Se hace la suposición que la distribución de la población de la duración de los focos de


esta empresa, en horas es la siguiente:

σ = 40

x
µ = 780
83
b) Para llegar a conocer estos parámetros poblacionales, se toman todas las muestras
posibles de tamaño 10. Se calcula la media y la desviación estándar de cada una de las
muestras. Se puede constatar que ninguna de las medias muestrales será la misma que
la media poblacional, pero tenderán a estar cerca.

s1 = 30 s2 = 25 s3 = 45 sn = 15

x x x x
x1 = 745 x2 = 770 x3 = 788 xn = 790

c) Se determina una distribución de todas las medias de cada muestra que se tomó,
llamada distribución de medias muestrales:

σ x = 12.65

x
µ x = 780

La distribución muestral de las medias que se obtiene al tomar todas las muestras es una
distribución teórica de muestreo. En la práctica, los estadísticos han constatado que es
suficiente tomar una muestra para obtener esta distribución.

Como se puede advertir, la media de las medias muestrales es igual a la poblacional y el


error estándar es igual a la desviación de la población, divida entre la raíz cuadrada del
tamaño muestral. Es de esa manera que se pueden determinar los parámetros
poblacionales.

4.1. Muestreo de poblaciones normales

El muestreo de poblaciones normales sigue las siguientes propiedades:

• La distribución de muestreo tiene una media igual a la media poblacional: µ x = µ


σ
• La distribución de muestreo tiene una desviación estándar: σ x = , llamada
n
error estándar.

• La distribución de muestreo está distribuida normalmente.

84
El ejemplo anterior muestra estas características, ya que la población de la vida media de
los focos se distribuía normalmente. Se puede observar que las distintas distribuciones
muestrales no están distribuidas normalmente, pero la distribución de medias muestrales
está distribuida normalmente.

Ejemplo.

El siguiente ejemplo muestra cómo el muestreo puede confirmar o validar las suposiciones
que se hacen con respecto a los parámetros poblacionales.

Un banco calcula que sus cuentas individuales de ahorro tienen una distribución normal.
Con media de 2000 $ y una desviación estándar de 600 $. Si el banco toma una muestra
aleatoria de 100 cuentas, ¿cuál es la probabilidad de que la media se halle entre 1900 y
2050?

Resolución.

El banco cree que la distribución de sus cuentas está distribuida normalmente, presentando
las siguientes características:

σ = 600

x [$]
µ = 2000

Para corroborar esta información, el banco realiza un muestreo de 100 cuentas. De acuerdo
a las propiedades del muestreo en poblaciones normales, se puede obtener la distribución
de medias muestrales:
600
σx = = 60
100

1900 2050 x
µ x = 2000

Para hallar la probabilidad de que la verdadera media de las cuentas se halle en el intervalo
de 1900 a 2050 $, es necesario obtener la distribución normal estándar, mediante la
variable tipificada y transformar los valores a dicha variable:

x−µ
z=
σx

85
1900 − 2000 2050 − 2000
z1 = = −1.67 z2 = = 0.83
60 60

σz =1

-1.67 0.83
z
µz = 0
Por último se determinan las probabilidades respectivas, mediante la tabla normal estándar,
que se encuentra en la parte de tablas estadísticas al final del texto.

P(1900 ≤ x ≤ 2050) = 0.4525 + 0.2967 = 0.7492

Respuesta: Hay una probabilidad del 74.92% de que el valor medio de las cuentas
individuales de ahorro del banco estén entre 1900 y 2050 $.

4.2. Muestreo de poblaciones no normales

¿Cómo reacciona la distribución de la media cuando la población de donde se extraen las


muestran no es normal? Esta pregunta se puede contestar gracias al teorema central del
límite. Antes de exponer este teorema, el ejemplo siguiente ayudará a aclarar esta
pregunta.

Ejemplo.

Se presenta la distribución de probabilidad de la población (discreta uniforme) dada por la


siguiente ecuación:

1
f ( x) = x = 1, 2, 3, 4,5, 6
6

que corresponde al experimento aleatorio de lanzar un dado y observar el resultado.

Determine:

a) La forma de la distribución de la población, su media y desviación estándar.


b) La forma de la distribución de medias muestrales, tomando todas las muestras posibles
de tamaño 2, su media y desviación estándar.
c) Compare: las medias y desviaciones y la forma de las dos distribuciones.
Resolución.

a) Características de la distribución de la población.

La forma de la distribución de la población es:


P(x)

1 86
6

1 2 3 4 5 6 x
Claramente se observa que la distribución no es normal.

Los parámetros poblacionales se hallan mediante la distribución de probabilidades, por


medio de las siguientes fórmulas:

x P(x) x P(x) x2 P(x)


1 1
6
1
6
1
6
2 1
6
2
6
4
6
3 1
6
3
6
9
6
4 1
6
4
6
16
6
5 1
6
5
6
25
6
6 1
6
6
6
36
6
Totale 1 21
6
91
6
s

n n
21 91
µ = ∑ xi P( xi ) = = 3.5 σ= ∑ x P( x ) − µ
2
i i
2
= − 3.52 = 1.708
i =1 6 i =1 6

b) Características de la distribución de las medias muestrales.

El número de muestras posibles de tamaño dos que se pueden formar, están dadas por la
combinatoria:

n n! 6 6!
 = = = = 15
 x  (n − x )! x !  2  (4)!2!

Las distintas muestras que se forman, y el cálculo de las medias de cada muestra son:

1-2 1-3 1-4 1-5 1-6 2-3 2-4 2-5 2-6 3-4 3-5 3-6 4-5 4-6 5-6
x : 1.5 2.0 2.5 3.0 3.5 2.5 3.0 3.5 4.0 3.5 4.0 4.5 4.5 5.0 5.5
La forma de la distribución de la primera muestra y el procedimiento del cálculo de su media
es:
P(x)
2
1 1
1 x1 = ∑ xi P ( xi ) = 1  + 2   = 1.5
2 i =1 2 2

87

1 2 x
Todas las muestras tienen la misma forma y sus medias se calculan mediante el mismo
procedimiento.

La tabla de la distribución de medias muestrales, determinada a partir de las medias de


todas las muestras es:

x P( x ) x P( x ) x 2 P ( x )
1.5 1
15
1.5
15
2.25
15
2.0 1
15
2
15
4
15
2.5 2
15
5
15
12.5
15
3.0 2
15
6
15
18
15
3.5 3
15
10.5
15
36.75
15
4.0 2
15
8
15
32
15
4.5 2
15
9
15
40.5
15
5.0 1
15
5
15
25
15
5.5 1
15
5.5
15
30.25
15
Totale 1 52.5
15
201.25
15
s

9 9
52.5 201.25
µ x = ∑ xi P( xi ) = = 3.5 σx = ∑ x P( x ) − µ
i
2
i
2
x = − 3.52 = 1.08
i =1 15 i =1 15

La gráfica de la distribución es:

P(x)

3
15
2
15
1
15

1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 x


c) Comparación.

Observando la forma de las dos distribuciones podemos concluir lo siguiente:

88
Sin importar la forma de la distribución de la población (si es normal o no), la distribución de
las medias muestrales tiende a tener una forma normal.

Observando los parámetros de la dos distribuciones se concluye:

La media poblacional es igual a la media de las medias muestrales.

El error estándar es igual a la desviación de la población dividida entre la raíz del tamaño de
muestra.
σ N − n 1.708 6−2
µ = µ x = 3.5 σx = * = * = 1.08
n N −1 2 6 −1

En este caso, como el tamaño de la población es finito, se incluye para el cálculo del error
estándar el multiplicador de población finita, que será descrito más adelante.

5. TEOREMA CENTRAL DEL LÍMITE

Las principales conclusiones del teorema central del límite son las siguientes:

• La media muestral es igual a la media poblacional prescindiendo del tamaño de la


muestra, aún cuando la población no sea normal.
• Al ir creciendo el tamaño de la muestra, la distribución muestral de la media se
acercará a la normalidad, cualquiera que sea la forma de la distribución de la
población.
• La relación existente entre la forma de la distribución de la población y la forma
de la distribución muestral de la media recibe el nombre de teorema central del
límite. Este, garantiza que la distribución muestral de la media se acerque a la
distribución normal a medida que crece el tamaño de la muestra.
• La importancia del teorema central del límite es que nos permite usar el
estadístico muestral para hacer inferencias sobre los parámetros de la población,
sin conocer nada sobre la forma de la distribución de esa población salvo la
información que logremos recoger de la muestra.

Ejemplo.

El siguiente ejemplo aplica las conclusiones del teorema central del límite.

La distribución de las ganancias anuales de todos los cajeros de un banco con 5 años de
experiencia tiene un sesgo negativo. Por estudios anteriores se sabe que la distribución
tiene una media de 15000 $ al año y una desviación de 2000 $. Si se extrae una muestra
aleatoria de 30 cajeros para verificar estos parámetros, ¿cuál es la probabilidad de que las
ganancias de los cajeros promedien más de 15750 $ al año?

Resolución.

La distribución de la población es la siguiente:

89
σ = 2000

µ = 15000 x [$]

Como se puede observar la distribución de la población no es normal. Este hecho no afecta


en nada, puesto que por medio del teorema central del límite, se sabe que la distribución de
las medias muestrales será normal.

2000
σx = = 365.16
30

15750 x
µ x = 15000

Determinando la distribución normal estándar:


σz =1

15750 − 15000
z= = 2.05
365.16

0.83
z
µz = 0

Calculando el valor de probabilidad para el valor de z respectivo, en la tabla de distribución


normal estándar:

P( x ≥ 15750) = 0.5 − 0.4798 = 0.0202

Conclusión: Existe un poco más del 2% de probabilidad de que las ganancias promedio
asciendan a más de 15750 $ al año en el grupo de cajeros.

6. TAMAÑO DE LA MUESTRA Y ERROR ESTÁNDAR

A medida que disminuye el error estándar, el valor de cualquier media muestral


probablemente se acerque más al de la media de la población. Conforme decrece el error
estándar, aumenta la precisión con que la media muestral puede emplearse para estimar la
media de la población. Sin embargo, se debe tomar en cuenta que el incremento de la

90
precisión no justifica el incremento adicional en el costo del muestreo. Rara vez conviene
extraer muestras excesivamente grandes.

Ejemplo.

Una empresa quiere determinar el tamaño de muestra que tendrá que usar para realizar
una encuesta de opinión sobre algunas características de su producto estrella. Se sabe por
estudios anteriores que la media mensual de consumo de este producto es de 10000
unidades, con una desviación de 100 unidades.

a) La empresa solo dispone de los fondos suficientes para que el estudio tenga un error
estándar igual a 31.63 ¿Cuál debe ser su tamaño de muestra?

b) ¿Cuál es el tamaño de la muestra si la empresa asigna más dinero y puede bajar el error
a 10?

Resolución.

El error estándar es:


σ
σx =
n

Despejando el tamaño de la muestra:

2
σ 
n= 
σx 

a) Si el error estándar debe ser igual a 31.63, el tamaño de la muestra será:

2
 100 
n=  = 10
 31.63 

a) Si el error estándar se reduce a 10, el tamaño de la muestra será:

2
 100 
n=  = 100
 10 

7. MULTIPLICADOR DE POBLACIÓN FINITA.

Para muestras que provienen de poblaciones infinitas o finitas con reposición el error
estándar es:
σ
σx =
n
Para muestras que provienen de poblaciones finitas, el error estándar es:
91
σ N −n
σx =
n N −1

donde: N, tamaño de la población


n, tamaño de la muestra
n
Se usa el multiplicador si la fracción de muestra es mayor o igual a 0.05.
N
Ejemplo.

Una cooperativa está constituida por una población de 20 compañías textiles del mismo
tamaño, todas las cuales sufren una excesiva rotación de personal. La desviación estándar
de la distribución de la rotación anual es de 75 empleados. Se muestrea 5 de esas
compañías.

a) Calcule el error estándar.


b) Si la cooperativa crece y se asocian 90 compañías más, calcule el error estándar, si se
muestrean 5 compañías.

Resolución.

n 5
a) La fracción = = 0.25 es mayor a 0.05. Por lo tanto el error estándar debe ir con el
N 20
multiplicador de población finita.

σ N − n 75 20 − 5
σx = = = 33.54(0.888) = 29.8
n N −1 5 20 − 1

n 5
b) La fracción = = 0.045 es menor a 0.05. Por lo tanto no se usa el multiplicador de
N 110
población finita por ser cercano a 1.

σ N − n 75 110 − 5
σx = = = 33.54(0.98) = 32.87
n N −1 5 110 − 1

El valor del error estándar no varía mucho si se incluye o no el multiplicador.

8. ÁRBOL DE DECISIÓN PARA LAS APLICACIONES DE LA DISTRIBUCIÓN


NORMAL.

Se muestra aquí un árbol de decisión para resolver problemas donde es necesario usar la
distribución normal.

92
ÁRBOL DE DECISIÓN PARA
LAS APLICACIONES DE LA DISTRIBUCIÓN NORMAL

No existe
Aproximación (x ± 0.5) − np
Normal normal a la Z=
binomial npq
No

Discreta
No existe Distribución
Normal normal
X−µ
z=
poblacional σ
No

Continua n σ
Cualquiera < 0.05 σx =
x −µ N n
Distribución
Normal z=
¿Tipo de de las medias
variable? muestrales
σx
Si σ N −n
Grande µx = µ n σx =
≥ 0.05
N n N −1
¿Existen
muestras? No normal

¿Forma de la Pequeño No se puede aplicar el


población? teorema central del
límite
¿Tamaño de
muestras?

93
9. ERRORES SISTEMÁTICOS EN EL MUESTREO

En cualquier investigación de tipo estadístico, además del error “involuntario” que se comete
debido al muestreo, pueden introducirse otro tipo de errores llamados sistemáticos (que se
los puede eliminar o minimizar al máximo), que se dividen en dos grupos.

9.1. Primer Grupo: errores de medición

a) Imputables al objeto.

Si se quiere determinar el peso medio de un grupo de individuos, éste estará influenciado


por la hora en la que se pesaron, la ropa que llevaban puesta, el tiempo desde que se
pesaron, etc.

b) Imputables al método.

Si en el ejemplo anterior se utilizaron distintas balanzas para el pesaje, unas más precisas
que otras, otras estando mal calibradas, etc.

c) Imputables al observador.

Presentes cuando no se han fijado bien los límites. Si en el anterior ejemplo se quería saber
también si la persona considera que tiene sobrepeso o no, algunas contestarán falsamente
que se consideran estar en buen estado, cuando no es así.

d) Errores de tabulación y cálculo.

Que son los más frecuentes. Ocurren por fallas de dictado, copiado, escritura, o por fallas
en los dispositivos para guardar la información o reproducirla. Ejemplo, si en el ejemplo
anterior una de las balanzas estaba en pulgadas y se hizo la transformación a kilogramos
con una base de conversión errónea, o se guardó los resultados en una planilla de datos, y
para hallar la media se aplicó una fórmula errónea. Se puede dar el caso que todos los
cálculos hayan sido correctos, pero la impresora falló y suministró datos distorsionados.

9.2. Segundo grupo: errores en la obtención de la muestra

a) Selección incorrecta.

En un estudio sobre los ingresos mensuales de obreros bolivianos dependientes, la


inclusión en la muestra de un grupo de obreros independientes (ya que su situación no está
catalogada de manera definida) podría hacer que la muestra no sea representativa.

b) No respuesta.

Algunas encuestas no fueron llenadas completamente y existe una falta de respuesta. Lo


normal es sustituir esta respuesta incorrectamente, preguntando a un elemento de la
población que no fue seleccionado aleatoriamente o en otros casos, dejarla en blanco.

94
c) Voluntarios.

La cooperación de voluntarios en cualquier estudio, falsea fácilmente los resultados, ya que


sus costumbres y características, en general, pueden no ser representativos de toda la
población.

10. ELEMENTOS DE IMPORTANCIA EN LAS ENCUESTAS MUESTRALES

Las diferentes etapas o el procedimiento a seguir en una encuesta por muestreo, son las
siguientes:

1. Establecimiento de los objetivos. Este punto determina todas las etapas posteriores.

2. Definición de la población. Se debe determinar con un buen grado de precisión quiénes


o qué componen la población en estudio para definir su tamaño. En algunos casos esto
no es fácil. Por ejemplo si se quiere realizar una investigación de las industrias de un
país, cabe preguntarse qué empresas están catalogadas como “industrias” y cuales no.

3. Determinación de los datos que se computarán. Es muy frecuente que se recopilen datos
innecesarios, y en cambio se olviden preguntas esenciales, en relación al objetivo de la
investigación. Es por eso que la encuesta debe configurarse por un grupo de expertos y
ser revisada minuciosamente antes de aplicarla.

4. Métodos de cuantificación. Cuidar de que una respuesta no varíe de acuerdo a la forma


en que es formulada y al orden que se le dé en la cédula.

5. Elección de la unidad de muestreo. En muchos casos un elemento de la población


constituye la unidad del muestreo, pero en otros casos grupos de elementos. Para los
últimos es necesario cuidar que los elementos estén solo en una unidad el muestreo.

6. Selección de la muestra. Existen muchos elementos para decidir el tamaño muestral,


pero en todo caso, existe una fuerte relación con el costo.

7. Organización del trabajo en el terreno. Deben tomarse varias medidas de planificación y


logística sobre cuestiones administrativas, como ser preparación y entrenamiento de los
encuestadores, viáticos, sueldos, control del llenado de encuestas, tiempo que usarán,
etc.

8. Revisión y publicación de los resultados. En primer lugar se revisará la información


obtenida en cada encuesta para verificar si ésta reúne las especificaciones adecuadas a
la investigación, caso contrario se eliminará. Luego se procede a la tabulación de los
datos, organización, descripción, presentación, análisis, toma de decisiones y
publicación.

9. Información futura. Los resultados obtenidos pueden ser archivados, ya que presentan
estimaciones sobre diversas características de la población que pueden variar en el

95
tiempo, y pueden ser útiles a la hora de comparar con resultados obtenidos por otras
encuestas en el futuro.

EJERCICIOS DE CLASE

1. De una población de 125 elementos, con una media de 105 y una desviación estándar
de 17, se eligieron 64 elementos.

a) ¿Cuál es el error estándar de la media?


b) ¿Cuál es la probabilidad: P(107.5 ≤ x ≤ 109) ?
c) ¿Cuál es la probabilidad: P(107.5 ≤ x ≤ 109) ?

2. Un equipo de salvamento submarino se prepara para explorar un sitio mar adentro frente
a la costa de Florida, donde su hundió una flotilla entera de 45 galeones españoles. A
partir de registros históricos, el equipo espera que estos buques naufragados generen un
promedio de 225000 $ de ingresos cada uno cuando se exploren, con una desviación
estándar de 39000 $. El patrocinador del equipo, sin embargo, se muestra escéptico y ha
establecido que si no se recuperan los gastos de exploración, que suman 2.1 millones de
$ con los primeros 9 galeones naufragados, cancelará el resto de la exploración. ¿Cuál
es la probabilidad de que la exploración continúe una vez explorados los 9 primeros
barcos?

3. Food Place, una cadena de 145 supermercados, fue comprada por otra mayor del mismo
rubro que opera a nivel nacional. Antes de que el trato se realice, la cadena mayor quiere
tener alguna seguridad de que Food Place será redituable. La cadena compradora ha
decidido echar un vistazo a los registros financieros de 36 de las tiendas de Food Place.
El gerente de ésta, afirma que las ganancias de cada tienda tienen una distribución
aproximadamente normal con la misma media y una desviación estándar de 1200 $. Si la
gerencia de Food Place está en lo correcto, ¿cuál es la probabilidad de que la media de
la muestra de las 36 tiendas se encuentre cerca de los 200 $ de la media real?

4. La media del número de estudiantes mujeres en cada materia de la impartida en la UPB


es 18 con una desviación de 8.

a) Se toman al azar 10 materias. ¿Cuál es la probabilidad de encontrar 20 o más


estudiantes mujeres en promedio?. ¿Se requiere del teorema central de límite para
resolver este inciso?
b) Si se asume que la distribución poblacional del número de estudiantes mujeres en
cada materia en la UPB es normal, hallar la misma probabilidad en una materia
cualquiera. Compare los resultados con el inciso anterior y haga un comentario.

5. El número de millas recorridas antes de que cierta clase de llantas empiece a verse
gastada es en promedio , 16.800 millas con una desviación estándar de 3.300 millas.
Una agencia de arrendamiento de automóviles compra 36 de estas llantas para cambiar
las de algunos vehículos y pone cada una en un vehículo diferente.

96
a) Encuentre la probabilidad de que las 36 llantas promedien menos de 16.000 millas
antes de verse gastadas.
b) Encuentre la probabilidad de que las 36 llantas promedien más de 18.000 millas antes
de verse gastadas.

EJERCICIOS PROPUESTOS

1. Identifique cada uno de los siguientes métodos de muestreo:

a) La población de interés está en orden alfabético. Iniciando con el séptimo apellido,


cada décimo nombre de ahí en adelante se seleccionó como elemento de la muestra.
Por tanto, la muestra consta de los números 7, 17, 27, 37, y así sucesivamente.
b) Un distrito extenso se subdividió en 16 áreas. Después 5 de estas áreas se
seleccionaron aleatoriamente, y también se seleccionaron al azar para ser
entrevistados los residentes de estas 5 regiones.
c) Los ejecutivos se subdividieron en tres grupos: bancarios, industriales y de seguros.
Se tomaron muestras aleatorias de cada uno de estos grupos, y se ponderaron los
resultados muestrales de acuerdo con el número en el grupo, en relación con el total.

2. El Dr. Lambert tiene a cinco estudiantes que realizaron estudios especiales con él este
semestre. Para evaluar el avance de lectura, el doctor aplica un examen de cinco
preguntas con respuestas verdadero/falso. El número de respuestas correctas para cada
estudiante se presenta a continuación.

Estudiante Número correcto


Torres 4
Cuevas 3
Flores 5
Ramos 3
Campos 2

a) ¿Cuántas muestras de tamaño dos son posibles con esta población?


b) Enliste todas las muestras posibles de tamaño dos y calcule las medias muestrales.
c) Organice las medias muestrales en una distribución probabilística.
d) Calcule la media de las medias muestrales y compárela con la media poblacional.
e) Compare la forma de la población, con la forma de la distribución de las medias
muestrales por medio de gráficas.

3. Un técnico de laboratorio de rayos X toma lecturas de su máquina para asegurarse de


que ésta se apega a las guías de seguridad federal. Sabe que la desviación estándar de
la cantidad de radiación emitida por la máquina es de 150 milirems, pero desea tomar
lecturas hasta que el error estándar de la distribución de muestreo no sea mayor de 25
milirems. ¿Cuántas lecturas debe tomar?

4. Dada una población de tamaño N = 80 con una media de 22 y una desviación estándar
de 3.2, ¿cuál es la probabilidad de que una muestra de 25 tenga una media de entre 21
y 23.5?
97
5. Al revisar las ventas habidas desde la apertura de un restaurante hace seis meses, el
dueño encontró que la cuenta promedio por pareja era de 26$, con una desviación
estándar de 5.65$. ¿Qué tan grande tendría que ser una muestra de clientes para que la
probabilidad fuera de al menos 95.44% de que el costo medio por comida para la
muestra cayera entre 25$ y 27$?
6. Low-Cal Food Company usa estimaciones del nivel de actividad de los diversos
segmentos del mercado para determinar la composición nutricional de sus productos de
comida dietética. Low-Cal está considerando la introducción de una comida dietética
líquida para mujeres maduras, puesto que este segmento tiene problemas especiales de
peso no resueltos por la comida dietética de su competidor. Para determinar el contenido
deseado de calorías de este nuevo producto, la doctora Nell Watson, investigadora de la
compañía, condujo pruebas sobre una muestra de mujeres para determinar el consumo
de calorías por día. Sus resultados mostraron que el número promedio de calorías
consumidas diariamente por las mujeres mayores es de 1328, con una desviación
estándar de 275. La doctora Watson estima que los beneficios que obtiene con un
tamaño de muestra de 25 costarían 1720$. Espera que al reducir el error estándar a la
mitad de su valor actual se duplique el beneficio. Si el costo es de 16$ por cada mujer de
la muestra, ¿debería Watson reducir su error estándar?

7. La HAL Corporation fabrica grandes sistemas de cómputo y siempre se ha ufanado de la


confiabilidad de sus unidades de procesamiento central del sistema 777. De hecho, la
experiencia pasada ha mostrado que el tiempo improductivo mensual de las CPU del
sistema 777 promedia 41 minutos, con una desviación estándar de 8 minutos. El centro
de cómputo de una gran universidad estatal mantiene una instalación formada por 6
CPUs del sistema 777. James Kitchen, el director del centro, siente que se proporciona
un nivel satisfactorio de servicio a la comunidad universitaria si el tiempo improductivo
promedio de los 6 CPU es menor de 50 minutos al mes. Dado cualquier mes, ¿cuál es la
probabilidad de que Kitchen se sienta satisfecho con el nivel de servicio?

98
EJERCICIOS PARA EXAMEN

PROBLEMAS DIVERSOS SOBRE MUESTREO

1. La media de mujeres en cada materia de la impartida en la UPB es 18 con una


desviación de 8.

a) Se toman al azar 10 materias ¿ Cual es la probabilidad de encontrar 20 o más


mujeres en promedio?. ¿se requiere del teorema central de límite para resolver este
inciso?.
b) Si se asume que la distribución poblacional es normal ¿Hallar la misma probabilidad
en una materia cualquiera? Compare los resultados con el inciso anterior y haga un
comentario?.

2. ¿Cuantas muestras de tamaño 2 es posible obtener de una población compuesta por los
elementos: a, b, c, d, e, f, g y h. ¿Cual es la probabilidad de que la muestra incluya al
elemento representado por la letra h?

3. Con base en sus volúmenes de ventas, 18 de las tiendas de ropa del shoping Soffer se
clasifican como pequeñas y las otras 6 como grandes. ¿Cuantas muestras estratificadas
diferentes de 4 de estas tiendas de ropa podemos seleccionar, si:

a) se debe distribuir la mitad de la muestra a cada estrato;


b) la distribución debe ser proporcional?

4. Suponga que usted es un investigador que ha sido contratado por la empresa cafetalera
Columbian Cofee Corporation. La empresa está interesada en determinar el porcentaje
de consumo de café por casa en Estados Unidos. Cree que el consumo anual por casa
está normalmente distribuido con una media desconocida µ y una desviación estándar
de aproximadamente 1.25 libras.

a) Si usted toma una muestra de 36 casas y registra su consumo de café durante un


año, ¿cuál es la probabilidad de que la media de la muestra esté en el intervalo de
media libra de la media de la población?.
b) ¿Qué tan grande debe ser la muestra que usted tome con el fin de estar 98% seguro
de que la media de la muestra está en el intervalo de media libra de la media de la
población?.

5. Barbara Johnson, gerente de producción de alarmas de humo de Southern Electric, está


preocupada por las quejas que ha recibido recientemente de grupos de consumidores
acerca de la corta vida del dispositivo. Ha decidido recabar la evidencia para
99
contrarrestar las quejas probando una muestra de alarmas. En cuanto a la prueba su
costo será de 4$ por unidad en la muestra. La precisión es deseable para presentar
evidencia estadística persuasiva a los grupos de consumidores, de tal manera que
Johnson considera que los beneficios que recibirá para los diversos tamaños de
5294
muestras son determinados por la formula: Beneficios = . Si la señorita Johnson
σx
desea aumentar su muestra hasta que el costo sea igual al beneficio, ¿cuantas unidades
debe muestrear?. La desviación estándar poblacional es 265.

6. Usted, como administrador de personal de una pequeña compañía recogió la siguiente


información de los días de ausentismo por año de la población de sus empleados:

1, 3, 6, 7, 7, 12

a) Suponiendo que se muestrea sin reposición, seleccione todas la muestras posibles de


tamaño 3 y establezca la distribución muestral de la media.
b) Calcule los parámetros de la población y los estadísticos de la distribución muestral de
la media. ¿Qué conclusión puede sacar al compararlas?.

7. Ron Blake, director de recursos humanos de una empresa, desea estudiar el nivel de
precisión de las 70 secretarias de su compañía. Anteriormente el número diario de
errores de procesamiento de palabras cometido por cada secretaria había sido
aproximadamente normal con un promedio de 18 y una desviación estándar de 4. El
señor Blake inspecciona actualmente a 15 secretarias elegidas aleatoriamente. ¿Cuál es
la probabilidad de que el número promedio de errores por secretaria sea:

a) Inferior a 15.5.
b) Mayor de 20.

100
PARTE III

INFERENCIA ESTADÍSTICA

CONCEPTO.

Es la rama de la Estadística que se ocupa del uso de los conceptos de la probabilidad para
afrontar la incertidumbre en la toma de decisiones. Los conceptos básicos de las
distribuciones muestrales, sirven como base para la estadística inferencial. Esta comprende
dos áreas:

• La estimación, que consiste en estimar los valores de los parámetros de la población


bajo estudio.

• Las pruebas de hipótesis, que constituyen el proceso de aceptar o rechazar


declaraciones o supuestos, generalmente relacionadas con parámetros poblacionales.
Estas pruebas se subdividen a su vez en:

• Pruebas paramétricas, si lo que se desea es probar una hipótesis acerca de un


parámetro poblacional en estudio.

• Pruebas no paramétricas, si lo que se desea es probar una hipótesis en las cual no se


requiere el uso de un parámetro poblacional.

APLICACIÓN.

El investigador puede preguntarse: ¿Cuándo se usa la estimación o la prueba de hipótesis?


Para ello, se resume a continuación los tipos de investigaciones que se pueden realizar.

Investigación exploratoria.

Se utiliza para los siguientes propósitos:

• Formular un problema o definirlo de manera más precisa.


• Identificar cursos alternativos de acción.
• Desarrollar hipótesis.
• Aislar variables y relaciones clave para un análisis posterior.
• Ganar comprensión para desarrollar un enfoque del problema.
• Establecer prioridades para una investigación posterior.

Se caracteriza por la versatilidad y flexibilidad de sus métodos. No se incluyen planes de


muestreo probabilísticos ni cuestionarios estructurados. Algunos son:

• Análisis con los expertos.


• Estudios piloto.
• Análisis de datos secundarios.
101
• Investigación cualitativa.

Con la información recopilada en una investigación exploratoria, generalmente se aplica


una investigación concluyente.

Investigación concluyente.

Es más formal y estructurada que la exploratoria. Se realiza un muestreo probabilístico para


que los datos estén sujetos a un análisis cuantitativo. El objetivo es:

• Generar datos concluyentes, que son auxiliares para la toma de decisiones en la


determinación, evaluación y selección del mejor curso de acción a seguir en una
situación determinada.

Este tipo de investigación se subdivide en dos tipos:

• Descriptivos. Su objetivo es describir las características o funciones de una determinada


situación. Aquí se usa la estimación estadística.
• Causales. Su objetivo es determinar las relaciones de causa y efecto sobre una
determinada situación, a partir de la investigación descriptiva. Aquí se usan las pruebas
de hipótesis.

ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA.

En los tres capítulos siguientes (Capítulos 4, 5 y 6) se revisarán los métodos llamados


paramétricos de la estadística inferencial y en el capítulo 7 los métodos no parámetricos.

Cabe recalcar aquí que la diferencia fundamental entre estos dos tipos de pruebas radica
en que en los primeros se debe realizar la suposición de que las muestras obtenidas por el
proceso de muestreo aleatorio deben haber sido extraídas de una población que se
comporta de forma normal, en cambio en los métodos no paramétricos no se requiere
realizar ninguna suposición acerca de la forma poblacional.

En todo caso, el investigador debe tomar en cuenta que cualquier problema inferencial que
se le presente puede ser resuelto mediante una prueba paramétrica o usando una prueba
no parámetrica, según cumpla la suposición o no de normalidad de la población.

102
CAPÍTULO 4

ESTIMACIÓN ESTADÍSTICA

1. INTRODUCCIÓN

Todo el mundo hace estimaciones. Cuando queremos cruzar la calle, estimamos la


velocidad del auto, la distancia entre él y nosotros y nuestra velocidad. Luego de efectuar
estas estimaciones tan rápidas, decidimos si debemos esperar o cruzar la calle. Los
gerentes hacen estimaciones rápidas. El resultado puede afectar a sus empresas. Todas
las personas efectúan estimaciones sin preocuparse si son científicas, con la esperanza de
que sus proyecciones guarden semejanza razonable con los resultados.

Cuando tomamos decisiones nos vemos obligados a veces a confiar en un simple


presentimiento. Pero en otras ocasiones, en las cuales disponemos de información y
aplicamos los conceptos estadísticos, podemos proceder de una manera más científica.

2. TIPOS DE ESTIMACIONES

Un estimador es un estadístico muestral con el cual se estima un parámetro de la población.


Una estimación es un valor específico observado de un estadístico.

En la vida real se desconocen los valores de los parámetros de las poblaciones que se
estudian. Se pretende entonces estimar estos valores que son de interés en nuestro
estudio. Para esto puede hacerse una:

• Estimación puntual, que es un valor único que pretende estimar el valor del parámetro
poblacional estudiado.
Ej: El promedio de ventas mensuales de una empresa es de 200 unidades.

Dos estimadores puntuales que se utilizan con frecuencia en estadística son: la media
muestral:
1 n
x= ∑ xi
n i =1
como estimador de la media poblacional, y la varianza muestral:

n n

∑( x − x ) ∑x
2
i
2
i − n x2
S2 = i =1
= i =1

n −1 n −1
como estimador de la varianza poblacional.

• Estimación por intervalo, que es un intervalo numérico en donde se pretende encontrar


el valor del parámetro bajo estudio.
Ej: El promedio de ventas mensuales de una empresa está entre 180 y 205 unidades.

103
3. CRITERIOS DE UN BUEN ESTIMADOR

1. Imparcialidad. Un estimador es imparcial o insesgado cuando, en promedio, los valores


del estimador coinciden con el verdadero valor del parámetro bajo estudio.

2. Consistencia o congruencia. Un estimador es congruente del parámetro de una


población si, al aumentar el tamaño de la muestra, se logra una seguridad casi absoluta
de que el valor del estadístico se acerca mucho al valor del parámetro de la población.

3. Eficiencia. La eficiencia designa el tamaño del error estándar del estadístico. Cuanto
menor sea, el estimador es más eficiente.

4. Suficiencia. Un estimador es suficiente si utiliza la información contenida en la muestra,


al punto que ningún otro estimador podría extraer de esta última más información
referente al parámetro de la población que va a ser estimado.

La media muestral es el estimador insesgado, congruente, eficiente y suficiente de la media


poblacional.

4. ESTIMACIÓN POR INTERVALOS

Una desventaja de los estimadores puntuales, es que no se sabe que tan cerca se
encuentran del valor del parámetro que estiman. No se tiene ninguna medida que indique
que tan precisa es nuestra estimación.

Con el fin de obtener alguna medida de la precisión en una estimación, se utiliza la


estimación por intervalos. El objetivo es determinar un intervalo de valores (intervalo de
confianza), el cual incluirá el valor del parámetro con una probabilidad prefijada (1 - α),
donde “α”, es la probabilidad de que el intervalo no contenga al verdadero valor del
parámetro, y es denominado nivel de significancia o riesgo. Por lo tanto, es deseable que
estos valores sean los más pequeños posibles: 0.01, 0.05, 0.1, etc.

Los intervalos de confianza de uso frecuente pueden ser construidos utilizando el método
del pivote.

4.1. Intervalos de confianza para la estimación de la media poblacional

4.1.1. Intervalo de confianza para estimar la media de una población normal, con
varianza conocida, sin importar el tamaño de la muestra

De una población normal, de la cual se quiere estimar la media, pero por alguna razón se
conoce su desviación estándar, se extrae una muestra aleatoria sin importar su tamaño.

La variable tipificada, para una población infinita es:

104
x −µ
z=
σ
n
sabiendo que tiene una distribución normal. Entonces:

σz =1
α 1−α α
2 2

z
− zα µz = 0 zα
2 2

El intervalo de confianza donde se pretende hallar la media de la población está


comprendido entre − z α y zα y 1 − α indica la probabilidad de que la media poblacional se
2 2

encuentre en ese intervalo:


(
P − zα < z < z α = 1 − α
2 2
)
Sustituyendo z por su ecuación:

 
 x −µ 
P  − zα < < zα  = 1 − α
 2 σ 2

 
 n 

Multiplicando la desigualdad simultánea por el error estándar:

 σ σ 
P  − zα < x − µ < zα  = 1−α
 2
n 2
n

σ
donde la cantidad e = z α se conoce como error máximo de estimación de la media.
2
n
Por último despejando la media de la desigualdad simultánea, se tiene el intervalo deseado:

 σ σ 
P  x − zα < µ < x + zα  = 1−α
 2
n 2
n

La interpretación del intervalo es la siguiente: Existe una probabilidad de 1 − α de que la


σ σ
media poblacional se halle entre x − zα y x + zα .
2
n 2
n

Ejemplo.

105
Como investigador de mercados, de una gran compañía de aparatos electrónicos de
consumo, quisiera estudiar las costumbres de ver televisión de los residentes en una ciudad
pequeña en particular. Por datos históricos se sabe que la desviación estándar es de 3.8
horas y que la población se distribuye normalmente. Para el efecto seleccionó una muestra
aleatoria de 40 entrevistados y a cada uno de ellos les dio instrucciones de mantener un
registro detallado de todos los programas de televisión que vieran en determinada semana.
Los resultados fueron los siguientes: Cantidad de televisión vista en la semana:
Media: 15.3 horas. Estime un intervalo de confianza del 95% para la cantidad
promedio de televisión vista cada semana en esta ciudad.

Resolución.

Primero se verifica que el problema cumpla con los requisitos para usar el intervalo
anteriormente construido:

• Población normal, la varianza de la población es conocida y el tamaño de muestra, que


es 40, en este caso no interesa.

En segundo lugar, se hallan los valores críticos de z, utilizando la tabla normal estándar. Un
gráfico en este caso es de mucha ayuda:
σz =1
α α
= 0.025 = 0.025
2 1 − α = 0.95 2

− zα = −1.96 0 zα = 1.96 z
2 2

Una vez obtenidos todos los datos, se reemplazan el en intervalo de confianza:

 3.8 3.8 
P 15.3 − 1.96 < µ < 15.3 + 1.96  = 95%
 40 40 
P (14.12 < µ < 16.48 ) = 95%

Conclusión: Hay una probabilidad del 95% de que la cantidad media semanal de los
habitantes de esa pequeña ciudad esté entre 14.12 y 16.48 horas.

4.1.2. Intervalo de confianza para estimar la media de una población normal, con
varianza desconocida, y tamaño muestral menor a 30.

De una población normal con media y varianza desconocida, es extrae una muestra
aleatoria de tamaño menor a 30 (observaciones independientes). Se sabe que:

106
n

x −µ ∑ (x − x )
i
2

t= s= i =1
s n −1
n

tiene distribución t de Student con n-1 grados de libertad, por lo que:

α 1−α α
2 2

−tα , n−1 tα ,n−1 t


2 2

( )
P −tα , n −1 < t < tα ,n −1 = 1 − α
2 2

Utilizando el método del pivote al igual que en el caso anterior, se obtiene el intervalo de
confianza deseado:

 s s 
P  x − tα , n −1 < µ < x + tα , n −1  = 1−α
 2
n 2
n

La interpretación del intervalo es la siguiente: Existe una probabilidad de 1 − α de que la


s s
media poblacional se halle entre x − tα , n −1 y x + tα ,n −1
2
n 2
n

Ejemplo.

Una empresa fabrica focos que tienen una duración distribuida aproximadamente en forma
normal. Si una muestra de 25 focos tiene una vida promedio de 780 horas, con una
desviación de 40 horas, obtenga un intervalo de confianza de 90% para la media de la
población de todos los focos producidos por esa empresa.

El paso 1 es siempre verificar que los datos se ajusten al intervalo apropiado:

• Población normal, no se conoce la desviación de la población y el tamaño de muestra


es menor a 30.

Luego, se hallan los valores críticos de t, mediante la distribución t de Student (ésta se


puede hallar en el anexo de tablas estadísticas al final del texto) y un gráfico adecuado,
para definir el valor de α :

107
0.05 0.90 0.05

t
−t0.05,24 = −1.7109 t0.05,24 = 1.7109

Por último se halla el intervalo, reemplazando la información obtenida:

 40 40 
P  780 − 1.7109 < t < 780 + 1.7109  = 90%
 25 25 

P ( 766.31 < t < 793.69 ) = 90%

Conclusión: Existe una probabilidad del 90% de que la duración media de los focos
producidos por esta empresa estén entre 766.31 y 793.69 horas.

4.1.3. Intervalo de confianza para estimar la media para cualquier caso que se
presente.

Se ha deducido los dos intervalos de confianza que más se usan. Sin embargo, existen
muchas combinaciones, ya que el intervalo depende de varias condiciones:

• Si la muestra proviene de una población normal o no.


• Si se conoce la varianza de la población o no.
• Si el tamaño de la muestra es menor a 30 o mayor o igual que ese valor.

A continuación se presentan todos los casos que pueden presentarse en un diagrama de


árbol. El estudiante deberá usarlo cuando tenga que resolver cualquier problema para la
estimación de la media poblacional.

108
ARBOL DE DECISIÓN PARA ESTIMACIÓN DE INTERVALOS

DE LA MEDIA DE LA POBLACIÓN

Utilice esta estimación por intervalo:

Cualquier n σ σ
Si P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n

Grande
s s
No n>30 P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n
Pequeño
s s
Normal n<30 P = (x - t α ,n − 1 * ≤ µ ≤ x+ tα ,n−1 * ) = 1 - α
2 n 2 n

Grande
σ σ
Si n>20 P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
No Normal 2 n 2 n
Pequeño
Forma de la σ σ 1
n<20
población P = (x - K ≤ µ ≤ x+ K ) =≥ 1 -
n n K2
Grande
s s
No n>50 P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n
¿Se conoce la varianza de la
Pequeño
población?
n<50
¿Tamaño de la No hay estimación por intervalo general conocida.
muestra?

109
4.2. Cálculo del tamaño muestral, para la estimación de la media poblacional

4.2.1. Cálculo del tamaño de la muestra, dado un error en la estimación de la media,


con varianza conocida.

Para población infinita.

Al realizar un estudio de mercado es imprescindible determinar el tamaño de la muestra, tal


que los intervalos que se vayan a calcular puedan inferirse a la población con un nivel de
seguridad prefijado por el investigador.

Para realizar este objetivo, se debe recordar que el error máximo que se puede cometer en
la estimación de la media es:
σ
e = zα
2
n

Observando la ecuación, se concluye que este error depende:

• Del nivel de confianza fijado.


• De la desviación estándar de la población.
• Del tamaño muestral.

Entonces, el mínimo tamaño de muestra para no exceder un error fijado, tomando en


cuenta una población infinita, vendrá dado por:

2
 σ
n =  zα 
 2 e

Para población finita.

Si se estima la media de una población finita, el error en la estimación está ponderado por
el factor de población finita:
σ N −n
e = zα
2
n N −1

Despejando n, se tiene:
2
 σ  N −n
n =  zα 
 2 e  N −1

El tamaño de muestra cuando la población es infinita es:

2
 σ
n0 =  z α 
 2 e

110
Reemplazando esta ecuación en el tamaño de muestra para población finita se tiene:

 N −n
n = n0  
 N −1 

Despejando n, se obtiene la ecuación para determinar el tamaño de muestra de una


población finita:

n0 N
n=
n0 + ( N − 1)

Si esta ecuación se traduce en términos de las variables originales, se tiene:

z 2σ 2 N
n=
z 2σ 2 + e 2 ( N − 1)

Ejemplo.

“Food Tiger”, una tienda local, vende bolsas de plástico para basura y ha recibido unas
cuantas quejas con respecto a la resistencia de tales bolsas. Parece ser que las bolsas que
se venden en la tienda son menos resistentes que las que vende su competidor “Food
Lyon” y en consecuencia, se rompen más a menudo. Como gerente encargado de
adquisiciones, usted está interesado en determinar el peso máximo promedio que puede
resistir una de las bolsas para basura sin que se rompa. Si la desviación estándar del peso
límite que puede aguantar una bolsa es de 1.2 kg, determine el número de bolsas que
deben ser probadas con el fin de que usted tenga una certeza del 95% de que el peso
límite promedio está dentro de 0.5 kg del promedio real.

a) Si se considera una población infinita.


b) Si el tamaño de la población de bolsas que se venden al año es de 10000.

Resolución.

a) Reemplazando todos los datos en la ecuación para población infinita y sabiendo que el
valor de z para una probabilidad de confianza del 95% es de 1.96, se tiene:

2
 1.2 
n0 = 1.96  = 22
 0.5 

Conclusión: Debe ser probada la resistencia al peso de 22 bolsas para que se tenga una
certeza del 95% de que el peso límite promedio está dentro de 0.5 kg. Del peso promedio
real.

b) Si la población es finita, se tiene:

111
1.9621.2210000
n= = 22
1.96 21.22 + 0.52 (10000 − 1)
Conclusión: Se observa que el tamaño de la muestra es igual si se considera población
n 22
finita o infinita. Esto se debe a que la fracción de muestra: = = 0.0022 es menor a
N 10000
0.05 y por lo tanto no se debía considerar el factor de población finita.

Ejemplo.

Usted muestreó el número adecuado de bolsas, de acuerdo a la estimación que realizó


anteriormente, y encontró que la media muestral del peso que resisten las bolsas fue de 10
kg. La competencia afirma que el peso medio que soportan sus bolsas es de 12 kg.
Determine un intervalo de confianza de 98% para la media del peso que resisten las bolsas
de su tienda e indique si la competencia vende mejores bolsas.

Resolución.

Como es un problema para la estimación de la media poblacional, se deberá usar el árbol


de decisión respectivo, dado en la página 23.

• Como no se conoce que el peso que resisten las bolsas sea normal, si se conoce la
varianza de la población y el tamaño de muestra determinado era mayor a 20, entonces
se elige el siguiente intervalo de confianza:

 σ σ 
P  x − zα < µ < x + zα  = 1−α
 2
n 2
n

Una vez elegido el intervalo apropiado, se obtienen todos los datos pertinentes, por medio
de la gráfica:

α α
= 0.01 = 0.01
2 1 − α = 0.98 2

− zα = −2.33 0 zα = 2.33 z
2 2

Reemplazando los datos en el intervalo:

 1.2 1.2 
P 10 − 2.33 < µ < 10 + 2.33  = 98%
 22 22 

P ( 9.4 < µ < 10.6 ) = 98%

Conclusión: Se puede afirmar que la competencia vende mejores bolsas que los que se
venden en Food Tiger.

112
4.2.2. Cálculo del tamaño de la muestra, dado un error en la estimación de la media,
con varianza desconocida.

En páginas anteriores se supuso que la desviación estándar de la población era conocida.


Sin embargo, esto no ocurre en la mayoría de los casos. En la vida real, será necesario
estimar esta desviación a partir de información muestral. Por lo tanto, el error màximo que
se puede cometer al estimar la media de una población con varianza desconocida es:

s
e = tα , np −1
2
n

donde: np es el tamaño de la muestra piloto, que se utilizó para estimar s.

Despejando n de esta ecuación, se obtiene el tamaño de muestra para poblaciones


infinitas:

2
 s
n =  tα , n p −1 
 2 e

Para obtener la ecuación para el tamaño muestral considerando poblaciones finitas, se


realiza el procedimiento anterior presentado cuando se conocía la varianza poblacional.
Entonces se obtiene:

t 2s2 N
n=
t 2 s 2 + e 2 ( N − 1)

Ejemplo.

¿Cuál debe ser el tamaño muestral si se quiere realizar una investigación para estimar el
precio promedio en el mercado de calculadoras científicas no programables, conociendo
que al realizar una prueba piloto de n=15, la desviación muestral fue de 10 $ y no se quiere
cometer un error mayor a 2 $, con una probabilidad de 95%?

a) Si se considera población infinita.


b) Si el tamaño de la población que compra este tipo de calculadoras por año en una ciudad
específica es de 2000?

Resolución.

113
a) Conociendo que si la certeza de confianza es del 95%, el valor de t0.025,14 es de 2.145, el
tamaño muestral será de:

2
 10 
n =  2.145  = 115
 2
b) si se considera una población de 2000 calculadoras:

2.145210 2 (2000)
n= = 109
2.145210 2 + 22 (2000 − 1)

Conclusión: Si se considera una población infinita, se deberán realizar 115 encuestas. Si se


considera que la población tienen 2000 compradores, se deberán realizar un muestreo de
tamaño 109.

4.2.3. Árbol de decisión para calcular el tamaño muestral.

El lector puede usar el árbol de decisión siguiente para calcular el tamaño de una muestra,
que presenta todos los casos que pueden darse, a la hora de realizar una investigación. El
caso del cálculo de la muestra para la estimación de la proporción de una población está
descrito más adelante.

114
ÁRBOL DE DECISIÓN PARA EL CÁLCULO

DEL TAMAÑO DE MUESTRA


2
Infinito  σ
n0 =  zα 
No importa
 2 e
z 2σ 2 N
Finito n=
z 2σ 2 + e 2 ( N − 1)

Si 2
Infinito  s
n0 =  z α 
 2 e
No z 2 s2 N
Finito n=
Media z 2 s 2 + e 2 ( N − 1)
No
2
 s
Infinito n0 =  t α ,n p −1 
Si  2 e

Finito t 2s2 N
Proporción n= 2 2 2
t s + e ( N − 1)
No importa
2
 zα 
¿Parámetro a Infinito n0 = pˆ (1 − pˆ )  2 
estimar? No importa  e 
¿Varianza  
conocida?
¿Tamaño de Finito pqz 2 N
n=
muestra piloto pqz 2 + e 2 ( N − 1)
conocido?
¿Tamaño de la
Población?

115
4.3. Intervalos de confianza para la estimación de la diferencia de medias

4.3.1. Intervalo de confianza para estimar la diferencia de medias de dos poblaciones


normales, con varianzas conocidas, y tamaños muestrales cualesquiera.

Se considera ahora la manera de realizar una estimación para comparar las medias de dos
poblaciones normales. Esta comparación se la realiza mediante la diferencia.

Se supondrán dos poblaciones normales, cuyas medias µ1 y µ 2 son desconocidas, pero


sus varianzas σ 12 y σ 22 son conocidas. Para realizar la estimación de la diferencia de
medias, se toman muestras n1 y n2 de las dos poblaciones y se obtienen datos de las
medias muestrales x1 y x2 . Entonces la variable tipificada es:

( x1 − x2 ) − (µ1 − µ 2 )
z=
σ 12 σ 22
+
n1 n2

siguiendo una distribución normal:


σz =1
α 1−α α
2 2

z
− zα µz = 0 zα
2 2

Con un intervalo de confianza:


(
P − zα < z < z α = 1 − α
2 2
)
Si se reemplaza z por su ecuación y se despeja la diferencia de medias, el intervalo que se
quiere obtener será:

 σ 12 σ 22 σ 12 σ 22 
P  ( x1 − x2 ) − z α + < µ1 − µ 2 < ( x1 − x2 ) + zα +  = 1−α
 2
n n 2
n n 
 1 2 1 2 

Ejemplo.

Usted desea investigar si en promedio el sueldo del hombre excede en más de 20 $ por
semana al de la mujer en su compañía. Según datos históricos las desviaciones estándar
para los sueldos han sido de 15.6 $ para los hombres y 18.20 $ para las mujeres. Si los
datos muestrales revelan que 20 hombres ganan en promedio 292.50 $ a la semana,
mientras que 20 mujeres perciben en promedio 266.10 $ por semana, ¿qué puede

116
concluirse con una certeza del 90%? Se considera que las poblaciones son
aproximadamente normales.

Resolución.

Se verifica que las condiciones del problema se ajusten al tipo de intervalo que se está
considerando:

• Ambas poblaciones son normales y se conocen sus desviaciones poblacionales.

Con la ayuda de un gráfico se obtienen los valores críticos de z:

0.05 0.05
0.9

− z0.05 = −1.64 z0.05 = 1.64 z

Reemplazando en la ecuación del intervalo:

 15.62 18.2 2 15.62 18.2 2 


P  (292.5 − 266.1) − 1.64 + < µ1 − µ 2 < (292.5 − 266.1) + 1.64 +  = 90%
 60 60 60 60 

P ( 21.31 < µ1 − µ 2 < 31.49 ) = 90%

Conclusión: Se comprueba que el sueldo promedio del hombre excede en más de 20 $ al


sueldo promedio de la mujer en esta compañía.

4.3.2. Intervalo de confianza para estimar la diferencia de medias de dos poblaciones


normales, con varianzas desconocidas, pero iguales y tamaños muestrales
menores a 30.

Se analiza dos poblaciones normales, con medias y varianzas desconocidas, pero éstas
últimas son iguales.

Bajo estos supuestos, el estadístico:

( x1 − x2 ) − ( µ1 − µ2 ) (n1 − 1) s12 + (n2 − 1)s22


t= donde S=
1 1 n1 + n2 − 2
S +
n1 n2

sigue una distribución t de Student con ν = n1 + n2 − 2 grados de libertad.

Utilizando el método del pivote, se llega a determinar el intervalo requerido:


117
 1 1 1 1 
P  ( x1 − x2 ) − tα ,ν S + < µ1 − µ 2 < ( x1 − x2 ) + t α ,ν S +  = 1 − α

2
n1 n2
2
n1 n2 

Ejemplo.

Los siguientes datos son el número de ventas que una muestra de 9 vendedores de
productos químicos en La Paz y una muestra de 6 vendedores en Cochabamba realizaron
en cierto período fijo.

La Paz: 59 68 44 71 63 46 69 54 48
Cochabamba: 50 36 62 52 70 41

Según registros de la compañía, se sabe que las poblaciones muestreadas pueden


aproximarse con distribuciones normales que tienen la misma varianza. Los vendedores
paceños creen que superaron el promedio de ventas de los cochabambinos, en ese
período, en más de 25. Hallar un intervalo de confianza del 99% para la diferencia del
número medio de ventas y diga si la afirmación de los vendedores paceños es verdadera o
no.

Resolución.

Se verifica si los datos del problema se ajustan al intervalo que se está estudiando:

• Las dos poblaciones son normales, con varianzas desconocidas pero iguales y los dos
tamaños de muestra son menores a 30.

Luego, con los datos muestrales se hallan los estadísticos requeridos:

Estadístico La Paz Cochabamba


Media 58 51.83
Varianza 109 160.97
Tamaño 9 6

Se hallan los valores críticos de t:

0.005 0.99 0.005

t
−t0.005,13 = −3.012 t0.005,13 = 3.012
Reemplazando los datos en el intervalo:

(9 − 1)109 + (6 − 1)160.97
S= = 11.36
9+6−2

118
 1 1 1 1
P  (58 − 51.83) − 3.012(11.36) + < µ1 − µ 2 < (58 − 51.83) + 3.012(11.36) +  = 99%
 9 6 9 6
P (11.86 < µ1 − µ2 < 24.20 ) = 99%

Conclusión: Los vendedores paceños no pudieron superar el promedio de ventas de los


vendedores cochabambinos en más de 25 unidades.

4.3.3. Intervalo de confianza para estimar la diferencia de medias de dos poblaciones


normales, con varianzas desconocidas y no necesariamente iguales y tamaños
muestrales menores a 30.

En la vida real, muy pocas veces se puede asumir que las varianzas de dos poblaciones
son iguales, a no ser que se pueda probar esta afirmación mediante pruebas previas. Por lo
tanto, si es que se considera que las dos varianzas no serán iguales se tiene que el
estadístico de prueba, con una distribución t de Student y con los siguientes grados de
libertad dados es:
2
 s12 s22 
 + 
( x1 − x2 ) − ( µ1 − µ2 ) n n
t= ν =  12 2  2 − 2
s12 s22  s12   s22 
+    
n1 n2  n1  +  n2 
n1 + 1 n2 + 1

El intervalo adecuado para este caso es el siguiente:

 s12 s22 s12 s22 


P  ( x1 − x2 ) − tα ,ν + < µ1 − µ2 < ( x1 − x2 ) + t α ,ν +  = 1−α
 2
n1 n2 2
n1 n2 

Ejemplo.

Se estudian dos fórmulas para obtener la resistencia de un plástico utilizado en la


fabricación de juguetes. El experto industrial afirma que no hay diferencia significativa en
las resistencias promedio que dan cada una de las fórmulas. Se duda de su afirmación, y
se experimenta, ya que la fórmula 1 es más cara, y según la bibliografía debía sobrepasar
la resistencia de la fórmula 2 en 10. Se obtuvo entonces la siguiente información muestral:

Estadístico Fórmula 1 Fórmula 2


Media 47.71 45.42
Varianza 11.57 9.95
Tamaño 7 7

Determine mediante un intervalo de confianza del 95% si existe diferencia significativa entre
las dos fórmulas.
Resolución.
119
• Aquí se supone que las poblaciones son normales, las varianzas son desconocidas y no
necesariamente iguales y los tamaños de muestra son menores a 30.

Se determinan primero los grados de libertad y luego los valores críticos de t:

2
 11.57 + 9.95 
 
ν=  
7
2 2
− 2 = 14
 11.57   9.95 
 7   7 
  + 
8 8

0.025 0.95 0.025

t
−t0.025,14 = −2.145 t0.025,14 = 2.145

Reemplazando todos los datos en el intervalo:

 11.57 9.95 11.57 9.95 


P  (47.71 − 45.42) − 2.145 + < µ1 − µ2 < (47.71 − 45.42) + 2.145 +  = 90%
 7 7 7 7 

P ( −4.30 < µ1 − µ 2 < 8.88 ) = 90%

Conclusión: El experto estaba en lo cierto. Las resistencias que otorgan de las dos fórmulas
no son significativamente diferentes.

4.3.4. Intervalo de confianza para estimar la diferencia de medias de dos poblaciones


normales, si las muestras son dependientes (datos pareados).

Los tres casos anteriores se aplican cuando las muestras son independientes, es decir que
los datos de una muestra no tienen ninguna relación de dependencia con los datos de la
otra. Ahora se verá el caso en que los datos de las muestras tienen relación pareada. Esto
se da cuando se realizan experimentos llamados “antes y después”. Lógicamente las
muestras deberán ser del mismo tamaño.

Para manejar datos de esta clase se trabaja con las diferencias (con signo) de los datos
apareados. El estadístico de prueba para tamaños de muestra pequeños (siempre se
supondrá que las muestras provienen de poblaciones con varianzas iguales) es el siguiente:

120
(x1 − x 2 ) − (µ1 − µ 2 )
t=
n

∑ (x
i =1
1 − x 2 ) 2 − n(x1 − x 2 ) 2

n −1

El intervalo construido a partir de este estadístico es el siguiente:

 n n 
 ∑ (x − x )1 2
2
− n( x1 − x2 ) 2 ∑ (x − x )
1 2 − n( x1 − x2 ) 2 
2

P  ( x1 − x2 ) − t α ,ν i =1
< µ1 − µ 2 < ( x1 − x2 ) + tα ,ν i =1  = 1− α
 2
n(n − 1) 2
n(n − 1) 
 
 

Un intervalo alternativo al anterior y más sencillo de hallar, es el siguiente:

 s s 
P  x − tα , n −1 < µ < x + tα , n −1  = 1−α
 2
n 2
n

si se considera que no se tienen dos muestras sino sólo una, compuesta por las diferencias
de los valores apareados.

Ejemplo.

Las siguientes son las pérdidas semanales de horas/hombre como consecuencia de


accidentes en diez plantas industriales antes y después de instaurar cierto programa de
seguridad.

Antes 45 73 46 124 33 57 83 34 26 17
Despué 36 60 44 119 35 51 77 29 24 11
s

Use el la probabilidad de confianza de 0.95 para probar si el programa de seguridad fue


efectivo.

Resolución.

Se hallan los estadísticos muestrales de la diferencia de valores antes y después:

Dif. 9 13 2 5 -2 6 6 5 2 6

x = 5.2 s = 4.08

Se determinan los valores críticos, mediante la distribución t:

0.025 0.95 0.025


121
t
−t0.025,14 = −2.262 t0.025,14 = 2.262
Se reemplazan todos los valores en el intervalo:

 4.08 4.08 
P  5.2 − 2.262 < µ < 5.2 + 2.262  = 95%
 10 10 
P ( 2.28 < µ < 8.12 ) = 95%

Conclusión: Como el intervalo muestra la diferencia entre las horas perdidas por accidentes
antes y después de un programa de seguridad, y los límites superior e inferior presentan
valores positivos, se puede concluir que el programa si fue eficaz, porque redujo las horas
perdidas por accidentes.

4.3.5. Intervalo de confianza para estimar la diferencia de medias de dos poblaciones


normales, para cualquier condición que se presente.

Se ha visto tres casos para la estimación de las medias de dos poblaciones normales, con
el propósito de compararlas. Sin embargo, dependiendo de las condiciones e información
que se puede tener, podrán surgir muchos otros casos.

A continuación se presenta un diagrama de árbol, para que el estudiante pueda usarlo para
resolver su problema de elegir el tipo de intervalo a usar en cualquier problema donde tenga
que realizar una estimación de la diferencia de medias.

122
ARBOL DE DECISIÓN PARA ESTIMACIÓN DE INTERVALOS
DE LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES

Utilice esta estimación por intervalo:


No 2 2 2 2
σ1 σ2 σ1 σ2
Cualquier n No P ((x1 − x2 ) - z α * + ≤µ1 − µ2 ≤ (x1 − x2 ) + z α * + ) =1- α
2 n1 n2 2 n1 n2

2 2 2 2
No s1 s2 s1 s2
No P ((x1 − x2 ) - z α * + ≤µ1 − µ2 ≤ (x1 − x2 ) + z α * + ) =1- α
2 n1 n2 2 n1 n2
Grande
Si s s
P (x − z α * ≤µ≤ x + z α * ) =1- α
2 n 2 n
Si Si
s s
Si P (x − t α * ≤µ≤ x + t α * ) =1 - α
,ν n ,ν n
n>30 2 2

1 1 1 1
P ((x1 − x2 ) - t α * s + + ) =1- α

≤µ1 − µ2 ≤ (x1 − x2 ) + t α *s
No Si ,ν
2 2
n1 n2 n1 n2
Si
(n1 − 1) s12 + (n 2 − 1) s 22 ν = n1 + n2 − 2
s=
¿Varianzas de n1 + n 2 − 2
n<30
las poblaciones
conocidas? Pequeño No 2 2 2 2
s1 s2 s1 s2
P ((x1 − x 2 ) − t α * + + ) =1- α

≤µ1 − µ2 ≤ (x1 − x 2 ) + t α *

¿Tamaño de las 2 2
No n1 n2 n1 n2
muestras? ¿Datos
2
pareados?  s12 s 22 
¿Varianzas  + 
n n2 
Iguales? ν =  12 2
−2
2
 s1   s 22 
   
 n1  +  n 2 
n1 + 1 n 2 + 1

123
4.4. Intervalos de confianza para estimar la varianza de una población

4.4.1. Intervalo de confianza para la varianza de una población normal, con tamaño de
muestra pequeño (n<30)

Si de una población normal, se extrae una muestra, se sabe que el estadístico de prueba
para estimar la varianza es:
(n − 1)s 2
χ =
2

σ2

el cual, tiene una distribución Chi-cuadrada con n-1 grados de libertad:

α
α
2 1−α
2

χ α2 χ2
χ12− α ,n −1
2 ,n −1
2

Mediante el método del pivote, se construye el intervalo:

( )
P χ 12− α , n −1 < χ 2 < χ 2α , n −1 = 1 − α
2 2

 (n − 1) s 2 
P  χ 12− α ,n −1 < 2
< χ 2α , n −1  = 1 − α
 2
σ 2

 (n − 1) s 2 (n − 1)s 2 
P  <σ < 2
2
 = 1−α
 χ 2α ,n −1 χ 1− α , n −1 
 2 2 

Ejemplo.

Tiger Woods cree que la consistencia de su juego, en realidad está dada por una
variabilidad de 5.9 en el puntaje que ha obtenido en todos los eventos en los que ha
participado hasta ahora. Para entrenar para el próximo torneo jugó 10 rondas de golf en su
campo privado y obtuvo un promedio de 71.3 puntos con una desviación estándar de 1.32.
¿Su juego fue consistente? Use un nivel de confianza del 95% y suponga que la población
es normal.

Resolución.

En primer lugar se verifica si el intervalo y los datos que se dan en el problema


corresponden al intervalo para la varianza:

124
• En efecto, como se habla de la variabilidad, se debe establecer una estimación para la
varianza de una población normal, con tamaño de muestra pequeño.

Luego, se obtienen los datos necesarios para estimar el intervalo, mediante la distribución
Chi-cuadrada (si desea más información sobre esta distribución puede dirigirse al anexo de
tablas estadísticas):

0.025 0.95
0.025
χ2
2
χ 0.975,9 = 2.7 2
χ 0.025,9 = 19.023

Una vez obtenidos todos los datos necesarios, se reemplazan en el intervalo:

 (10 − 1)1.322 (10 − 1)1.322 


P <σ 2 <  = 95%
 19.023 2.70 

P ( 0.824 < σ 2 < 5.808 ) = 95%

Conclusión: Se puede verificar que su juego de entrenamiento fue consistente, ya que tanto
el valor inferior como el superior del intervalo son inferiores a la variabilidad de 5.9.

4.4.2. Intervalo de confianza para la varianza de una población normal, con tamaño de
muestra grande ( n ≥ 30 )

Cuando es posible tomar muestras grandes ( n ≥ 30 ), la distribución muestral de la


desviación se puede aproximar en forma general a una distribución normal, con media σ y
σ
desviación estándar , siendo el estadístico de prueba:
2n
σ
σz =
2n
α α s −σ
1−α z=
2 2 σ
2n
z
− zα µz = σ zα
2 2

Aplicando el método del pivote, se encuentra el intervalo deseado:

125
( )
P − zα < z < z α = 1 − α
2 2

 
 s −σ 
P  − zα < < zα  = 1 − α
 2 σ 2

 
 2n 

 
 
s s
P <σ <  = 1−α
 zα zα 
1+ 2 1− 2 
 2n 2n 

Ejemplo.

Se realizó una prueba de resistencia a la tensión en 50 cuerdas de algodón, obteniéndose


una desviación estándar de 11 libras. Encuentre un intervalo de 95% de confianza para la
verdadera desviación estándar de estas resistencias.

Resolución.

• Como la muestra es suficientemente grande se pude usar la aproximación a la normal.

Los datos necesarios son:

0.95
0.025 0.025

− z0.025 = −1.96 z0.025 = 1.96 z


Reemplazando los datos en el intervalo:

 
 11 11 
P <σ <  = 95%
1+ 1.96
1 −
1.96 
 2(50) 2(50) 
 

P ( 9.2 < σ < 13.7 ) = 95%

4.5. Intervalo de confianza para estimar el cociente de varianzas en


poblaciones normales

126
Cuando se quiere comparar la variabilidad entre dos poblaciones que se distribuyen
normalmente, se extraen muestras de las dos poblaciones de tamaño en general pequeño,
y se compara mediante el cociente. La variable que se usa es:
s12
σ2
F = 12
s2
σ 22

que tiene una distribución F de Fisher, con n1 − 1 grados de libertad en el numerador y


n2 − 1 grados de libertad en el denominador:

α 1−α α
2 2
F
F1− α ,n1 −1,n2 −1 Fα ,n1 −1,n2 −1
2 2

Si se requiere un estudio más detallado de la distribución de Fisher, éste se encuentra en el


anexo de tablas estadísticas.

Se obtiene el intervalo deseado, por el método del pivote:

(
P F1− α , n −1, n −1 < F < Fα ,n −1, n −1 = 1 − α
2 1 2 2 1 2
)
 s12 
 2 
σ1
P  F1− α ,n1 −1, n2 −1 < < Fα , n −1, n −1
 = 1−α
 2 s22 2 1 2

 2 
 σ2 

 s2 1 σ 2 s2 1 
P  12 < 12 < 12  = 1−α
 s2 Fα ,n −1,n −1 σ 2 s2 F1− α , n −1, n −1 
 2 1 2 2 1 2 

1
Aplicando la propiedad de la distribución de Fisher, que dice que: Fα ,ν1 ,ν 2 = al lado
F1−α ,ν 2 ,ν1
derecho de la desigualdad, se tiene un intervalo alternativo al anterior:

 s2 1 σ 2 s2 
P  12 < 12 < 12 Fα ,n2 −1, n1 −1  = 1 − α
 s2 Fα , n −1,n −1 σ 2 s2 2 
 2 1 2 

127
Ejemplo.

La HAL Corporation en la que usted es el gerente está a punto de poner en el mercado una
computadora personal nueva más rápida, PAL, que sustituirá a su viejo modelo, CAL. A
pesar de que, en promedio, la PAL es más rápida que CAL, la velocidad de procesamiento
de la nueva computadora parece ser más variable. (La velocidad de procesamiento
depende del programa que se esté corriendo, la cantidad de datos de entrada y la cantidad
de datos de salida). Dos muestras de 25 corridas, que cubrían la diversidad de tareas
esperadas, fueron suministradas a cada computadora (una muestra a cada una). Los
resultados fueron los siguientes:

Estadístico Tiempo de procesamiento


(en centésimas de segundo)
PAL CAL
Media 50 75
Desviación estándar 20 10

Construya un intervalo de confianza del 95% que relacione las variabilidades de las
velocidades de procesamiento de la nueva con respecto a la vieja computadora. Si la tasa
de variabilidad de la velocidad de procesamiento de la PAL con respecto a la CAL es menor
a 1.76, usted lanzará la nueva computadora al mercado, caso contrario, su compañía
tendrá que realizar ajustes en la variabilidad de la PAL y esperar los resultados. ¿Cuál es su
decisión?

Resolución.

• Como se trata de dos poblaciones y se quiere comparar las variabilidades de las dos
computadoras, es necesario realizar una estimación del cociente de varianzas.

Mediante un gráfico de la distribución F, se obtienen los datos necesarios:

0.95
0.025 0.025
F
1 1 F0.025,24,24 = 2.27
F0.975,24,24 = =
F0.025,24,24 2.27

Reemplazando los datos en el intervalo:

128
  20  2 1 σ 2  20 
2

P   < 12 <   2.27  = 95%
  10  2.27 σ 2  10  
 

 σ2 
P 1.762 < 12 < 9.080  = 95%
 σ2 

Conclusión: Como el valor inferior y superior del intervalo del cociente de varianzas es
mayor a 1.76, la compañía no podrá lanzar al mercado la computadora PAL, sino que
deberá realizar ajustes en su variabilidad.

4.6. Intervalo de confianza para la estimación de la proporción tomando


muestras grandes

Ahora se quiere saber el porcentaje o proporción de la población que cumplen con ciertos
requisitos o no. Para ello se toma una muestra de tamaño mayor a 30. El estadístico sigue
una distribución binomial, pero que puede aproximarse a una normal:

pˆ (1 − pˆ )
σz =
n pˆ − p
z=
α α pˆ (1 − pˆ )
1−α
2 2 n

z
− zα µz = p zα
2 2

Y número de elementos éxito


donde: pˆ = = (es la proporción muestral).
n tamaño muestral

Retomando el método del pivote, se llega a la construcción del intervalo adecuado:

(
P − zα < z < z α = 1 − α
2 2
)
 
 pˆ − p 
P  − zα < < zα  = 1 − α
 2 pˆ (1 − pˆ ) 2

 
 n 

 pˆ (1 − pˆ ) pˆ (1 − pˆ ) 
P  pˆ − z α < p < pˆ + z α  = 1 − α

2
n 2
n 

129
Ejemplo.

Observando la cantidad de contaminantes atmosféricos en una ciudad de Bolivia durante


500 días, se encontró un exceso de 200 microgramos solo 8 veces. Construir un intervalo
de confianza del 99% para la probabilidad de que la contaminación exceda 200
microgramos por metro cúbico en un día cualquiera.

Resolución.

• Claramente el problema da a entender que se necesita un intervalo de confianza para la


proporción de encontrar exceso de contaminación en un día cualquiera.

Como ya se repitió este procedimiento demasiadas veces, se acortarán los pasos, diciendo
8
que el valor de z es de 2.58 y la proporción muestral es de pˆ = = 0.016 Reemplazando
500
los datos en el intervalo, se tiene:

 0.016(1 − 0.016) 0.016(1 − 0.016) 


P  0.016 − 2.58 < p < 0.016 + 2.58  = 99%
 500 500 

P ( 0.15% < p < 3.05% ) = 99%

Conclusión: Existe una probabilidad del 99% de que la proporción de exceso de


contaminación de 200 microgramos por metro cúbico en un día cualquiera sea de 0.15% a
3.05%.

4.7. Intervalo de confianza para la estimación de la diferencia de proporciones


tomando muestras grandes

Así como para comparar las medias de dos poblaciones se realiza un intervalo de la
diferencia de medias, así también para comparar las proporciones de dos poblaciones, se
puede realizar un intervalo de confianza para la diferencia de éstas.

De esta manera, el estadístico:

( pˆ1 − pˆ 2 ) − ( p1 − p2 )
z=
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
+
n1 n2

sigue una distribución normal estándar, si las muestras son lo suficientemente grandes, y
donde:

130
Y1 Y2
pˆ1 = y pˆ 2 =
n1 n2

donde Y1 y Y2 son el número de elementos éxito en las muestras 1 y 2, respectivamente.


Usando el método del pivote se encuentra el intervalo para la diferencia de proporciones:

(
P − zα < z < z α = 1 − α
2 2
)
 
 
( pˆ1 − pˆ 2 ) − ( p1 − p2 )
P  − zα < < zα  = 1 − α
 2 pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) 2 

 + 
 n1 n2 

 pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) 


P  ( pˆ1 − pˆ 2 ) − zα + < p1 − p2 < ( pˆ1 − pˆ 2 ) + zα +  = 1 − α
 n1 n2 n1 n2
 
2 2

Ejemplo.

En un estudio acerca del comportamiento de dos máquinas en un proceso productivo, se


encontró la siguiente información:

Número de artículos Número de artículos


inspeccionados fuera de
especificación
Máquina 1 85 12
Máquina 2 120 17

Construya un intervalo de confianza de 95% para la diferencia de las proporciones de


artículos fuera de especificación producidos por las máquinas 1 y 2.

Resolución.

Mediante los datos provistos se puede hallar las proporciones muestrales:

12 17
pˆ1 = = 0.1411 y pˆ 2 = = 0.1416
85 120

Reemplazando los valores en el intervalo:

 0.1411(1 − 0.1411) 0.1416(1 − 0.1416) 


P  (0.1411 − 0.1416) − 1.96 + < p1 − p2 < ...  = 95%
 85 120 
Ya no se escribió el límite superior del intervalo, ya que es exactamente igual al inferior, con
un signo positivo en el valor crítico.

131
P ( −9.71% < p1 − p2 < 9.61% ) = 95%

4.8. Cálculo del tamaño muestral, para la estimación de la proporción


poblacional

Para muestras infinitas.

Al realizar un estudio de mercado es imprescindible determinar el tamaño de la muestra, tal


que los intervalos que se vayan a calcular puedan inferirse a la población con un nivel de
seguridad prefijado por el investigador.

Para realizar este objetivo, se debe recordar que el error máximo que se puede cometer en
la estimación de la proporción es:
pˆ (1 − pˆ )
e = zα
2
n

Observando la ecuación, se concluye que este error depende:

• Del nivel de confianza fijado.


• De la proporción muestral.
• Del tamaño muestral.

Entonces, el mínimo tamaño de muestra para no exceder un error fijado, tomando en


cuenta una población infinita, vendrá dado por:
2
 zα 
n0 = pˆ (1 − pˆ )  2 
 e 
 
Para población finita.

Si se estima el tamaño de muestra para la estimación de una proporción, cuando la


población es finita, entonces se tiene:
n0 N pqz 2 N
n= n=
n0 + ( N − 1) pqz 2 + e 2 ( N − 1)

donde: q = 1 − p , es decir la proporción muestral de fracasos.

Los investigadores de mercados, utilizan generalmente esta ecuación, puesto que a


menudo se quiere saber proporciones de consumo, gustos, preferencias, etc. de la
población.

Los valores que se usan frecuentemente, para hallar el mayor tamaño de muestra con el
cual realizar inferencias confiables, son:

132
p = 0.5 y q = 0.5 . Estos valores asumen que la población no tiene preferencias por el
elemento éxito.
z = 1.96 , que corresponde a una probabilidad de confianza de 95%.
e = 0.05 , es decir que el error máximo que se desea cometer en la estimación es del 5%.

Si se reemplazan estos valores en la ecuación, se tiene:


0.9604 N
n=
0.9104 + 0.05 N

Ejemplo.

Según datos obtenidos del sitio web del Instituto Nacional de Estadística, la población de
Cochabamba para el año 1999 era: 1’484.867 habitantes: 836.232 área urbana y 648.635
área rural.

Una empresa quería saber en ese año la proporción de personas en el área urbana que
consumía su producto y para ello necesitaba saber qué tamaño de muestra debía tener,
para que sus resultados sean confiables y se puedan inferir a toda la población. Para este
estudio la empresa trabajó con una probabilidad de confianza del 95%, que arroja un valor
de z de 1.96, y un error de estimación del 5%. Una probabilidad a favor de 50%. Estos
valores son usados generalmente en un estudio de mercado.

Resolución.

Reemplazando en la ecuación los valores se halla el tamaño de muestra:

0.9604(836232)
n= = 20
0.9104 + 0.05(836232)

Conclusión: la empresa debió encuestar a 20 personas para conocer la verdadera


proporción de la población del área urbana de la ciudad de Cochabamba que consume su
producto.

5. ÁRBOL DE DECISIÓN PARA LA ELECCIÓN DEL INTERVALO DE


CONFIANZA ADECUADO EN LA RESOLUCIÓN DE PROBLEMAS

En este capítulo se ha tratado de analizar y estudiar exhaustivamente todos los intervalos


de confianza que se pueden usar en el campo de la investigación usando la estadística
inferencial. Sin embargo, se propone a continuación un árbol de decisiones que servirá
como una guía didáctica para que el lector pueda elegir con mayor facilidad el tipo de
intervalo adecuado para la resolución de problemas, tanto los que se presentan en el curso
de estadística inferencial como los que tiene que resolver un profesional en su empresa. El
lector podrá usar este árbol cada vez que quiera resolver un problema sobre intervalos de
confianza.

133
ÁRBOL DE DECISIÓN PARA ELEGIR EL INTERVALO DE CONFIANZA

ADECUADO EN LA RESOLUCIÓN DE PROBLEMAS

Media (Árbol de decisión)


Promedio
 
Medio
 
 s s
P <σ <  = 1−α
Variación
 zα zα 
n>30
Variabilidad 1+ 2 1− 2 
Varianza  2 n 2n 
 (n − 1) s 2 (n − 1) s 2 
N<30 2
P 2 <σ < 2  = 1−α
Fracción  χ α , n −1 χ 1− α ,n −1 
Porcentaje  2 2 
Una
Probabilidad
 pˆ (1 − pˆ ) pˆ (1 − pˆ ) 
Proporción < p < pˆ + zα
2 2
P  pˆ − zα  = 1 − α
 n n 
Comparación Diferencia de medias (Árbol de decisión)
Dos de promedios

¿Número de Relación de  s2 
variabilidades 1 1 σ 12 s12 1
poblaciones? Cociente de varianzas 
P 2 < <  = 1−α
 s2 Fα , n −1, n −1 σ 22 s22 F1−α ,n −1,n −1 
 2 1 2 2 1 2 
Comparación
de fracciones
o porcentajes
Diferencia
de proporciones
 pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) 
P  ( pˆ1 − pˆ 2 ) ± zα + < p1 − p2 < ...  = 1 − α
¿Cuál es la  2 n1 n2 
 
palabra clave?

134
EJERCICIOS DE CLASE

Aclaración: En todos los problemas que se presentan a continuación, se hace la suposición


de que las muestras extraídas provienen de poblaciones aproximadamente normales.

Intervalo de confianza para la media de una población normal con varianza conocida.

1. El gerente de la división de bombillas de la Cardinal Electric debe estimar el número


promedio de horas que durarán los focos fabricados por cada una de las máquinas. Fue
elegida una muestra de 40 focos de una máquina A y el tiempo promedio de
funcionamiento fue de 1416 horas. Se sabe que la desviación estándar del tiempo de
duración es de 30 horas.

a) Calcule el error estándar de la media.


b) Construya un intervalo de confianza de 90% para la media de la población.

2. Después de recolectar una muestra de 250 elementos de una población con una
desviación estándar conocida de 13.7, se encuentra que la media es de 112.4.

a) Encuentre un intervalo de confianza de 95% para la media.


b) Encuentre un intervalo de confianza de 99% para la media.

Intervalo de confianza para la media de una población normal con varianza


desconocida.

3. La siguiente muestra de 8 observaciones fue tomada de una población infinita con


distribución normal:

75.3 76.4 83.2 91.0 80.1 77.5 84.8 81.0

a) Encuentre la media
b) Estime la desviación estándar de la población.
c) Construya un intervalo de confianza de 98% para la media.

4. Los costos variables, principalmente de la mano de obra, hacen que los precios de la
construcción de casas varíen de una edificación a otra. Un constructor de casas
estándares necesita tener una ganancia media arriba de 8500 $ por casa para alcanzar
una ganancia anual establecida como meta. Las ganancias por casa para las 5
edificaciones más recientes del constructor, son de:

8760 6370 9620 8200 10350

Encuentre un intervalo de confianza de 95% para el promedio de la ganancia del


constructor por edificación. Interprete el intervalo.

135
Cálculo del tamaño de la muestra dado un error en la estimación de la media.

Con desviación estándar conocida.

5. Suponga que la UMSS está efectuando una investigación acerca de los ingresos anuales
de los estudiantes del último año de la facultad de Administración. Se sabe, por la
experiencia obtenida, que la desviación estándar de los ingresos anuales de la población
completa de los egresados es de aproximadamente 1500 Bs ¿Qué tan grande debe ser
la muestra que la universidad debe tomar con el fin de estimar los ingresos medios
anuales de los estudiantes del último año dentro de mas y menos 500 Bs y con un nivel
de confianza de 95%?

Con desviación estándar desconocida.

6. Se desea estimar la resistencia media a la compresión de cierta clase de ladrillos


producidos por una fábrica. Una muestra piloto de 16 ladrillos arrojó una desviación
estándar en las resistencias de 8 kg/cm2. Si se desea que el error en la estimación de la
media no exceda a 2 kg/cm2, con una confianza de 90% ¿cuántos ladrillos deberá
contener la muestra que se utilice para estimar la media?

Intervalo de confianza para la diferencia entre dos medias para una población normal
con varianzas conocidas.

7. Considerando que los fallos emitidos por un tribunal acerca de responsabilidad legal
varían en el tiempo, una compañía de seguros quiere comparar el nivel promedio de los
fallos actuales acerca de la responsabilidad personal, con los del año pasado. Se
seleccionó una muestra aleatoria de 30 casos de entre los procesados durante cada uno
de los períodos anuales. Se indican las medias muestrales y las varianzas de los fallos
acerca de la responsabilidad (en millones de dólares), para cada uno de los dos años, en
la tabla siguiente. Encuentre un intervalo de confianza de 90% para la diferencia entre
los niveles promedio de los fallos acerca de responsabilidad legal, para este año y el
anterior.

Año n Media (millones de $) Varianza Poblacional

En curso 30 1.32 0.97734


Anterior 30 1.04 0.7291

Intervalo de confianza para la diferencia entre dos medias para una población normal
con varianzas desconocidas y no necesariamente iguales.

8. Los siguientes datos son las horas-hombre que semanalmente se pierden en promedio
por accidentes en 10 plantas industriales con cierto programa de seguridad y otras 10
con otro programa.
Programa 1 45 73 46 124 33 57 83 34 26 17
Programa 2 36 60 44 119 35 51 77 29 24 11

136
Calcúlese un intervalo de confianza de 90% para la media del mejoramiento en las
horas- hombre perdidas.

Intervalo de confianza para la diferencia entre dos medias para una población normal
con varianzas desconocidas pero iguales.

9. Los siguientes datos son el número de ventas que una muestra de 9 vendedores de
productos químicos en California y una muestra de 6 vendedores en Oregon realizaron
en cierto período fijo:

California 59 68 44 71 63 46 69 54 48

Oregon 50 36 62 52 70 41

Suponiendo que las poblaciones muestreadas pueden aproximarse con distribuciones


normales que tienen la misma varianza, hallar un intervalo de confianza del 99% para la
diferencia del número medio de ventas.

Intervalo de confianza para la diferencia entre dos medias para una población normal
para datos apareados.

10. El club deportivo “Rodriana” ha estado anunciando un riguroso programa de


acondicionamiento físico. El club asegura que después de un mes de llevar el
programa, un participante promedio será capaz de hacer ocho lagartijas (o flexiones)
más en dos minutos que las que podía hacer al principio. ¿La muestra aleatoria de 10
participantes en el programa, cuyos datos se dan en la tabla siguiente, apoya la
afirmación del club? Utilice una probabilidad de confianza del 0.975.

N° 1 2 3 4 5 6 7 8 9 10
Antes 38 11 34 25 17 38 12 27 32 29
Despué 45 24 41 39 30 44 30 39 40 41
s

Intervalo de confianza para la varianza de una población normal (para muestras


pequeñas).

11. Un gerente de control de calidad de una compañía estaba convencido de que una
balanza, para pesar materia prima, variaba según una desviación estándar igual a 2. A
fin de probar el equipo se pesó una carga de 107 libras, y se registraron las mediciones
de 104.1, 105.2 y 110.2. Obtenga un intervalo de confianza de 90% para la varianza.

Intervalo de confianza para la varianza de poblaciones normales (tomando muestras


grandes).

12. Se realizó una prueba de resistencia a la tensión en 50 cuerdas de algodón,


obteniéndose una desviación estándar de 11 libras. Encuentre un intervalo de 95% de
confianza para la verdadera desviación estándar de estas resistencias.

137
Intervalo de confianza para el cociente de varianzas en poblaciones normales.

13. La variabilidad en la cantidad de impurezas presentes en un lote de productos


químicos, utilizada para un proceso particular, depende del tiempo que tarda el
proceso. Un fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño
ajuste al proceso 2, con esperanza de reducir la variabilidad, así como la cantidad
media de impurezas en los productos químicos. Muestras de 25 mediciones de dos
lotes cada uno produjeron las siguientes medias y varianzas:

x1 = 3.2 s12 = 1.04


x 2 = 3.0 s 22 = 0.51

Hallar un intervalo de confianza del 90% para el cociente de varianzas.

Intervalo de confianza para una proporción tomando muestras grandes.

14. Una fábrica produce bolsas de papel. El contrato con sus clientes le permite una
fracción defectuosa no mayor del 5%. En una muestra de 200 bolsas, se encontraron 6
defectuosas. Encuentre un intervalo de 95% de confianza para la verdadera fracción
defectuosa de esta fábrica.

Intervalo de confianza para la diferencia entre dos proporciones tomando muestras


grandes.

15. En un estudio acerca del comportamiento de dos máquinas en un proceso productivo,


se encontró la siguiente información:

Número de artículos Número de artículos fuera


inspeccionados de especificación

máquina 1 85 12

máquina 2 120 17

Construya un intervalo de confianza del 95% para la diferencia de las proporciones de


artículos fuera de especificación producidos por las máquinas 1 y 2.

Cálculo del tamaño muestral, para estimar la proporción de la población.

16. Un investigador de mercados quiere estimar el porcentaje de personas mayores de 50


años que usan chalecos de lana. Para determinar la proporción a favor que le sirva
como dato para el cálculo de la muestra, realizó una muestra piloto, donde de 20
personas que cumplían con la característica de la edad, 16 dijeron que usan chalecos
de lana. El desea realizar esta estimación con un error que no supere el 4% y con una
probabilidad de confianza del 97%.

138
EJERCICIOS PROPUESTOS

Aclaración: En todos los problemas que se presentan a continuación, se hace la suposición


de que las muestras extraídas provienen de poblaciones aproximadamente normales.

1. El supermercado Anita que usted administra compró hace poco una carga de 1500 cajas
de 24 onzas de cereal cada una. Una muestra aleatoria de 57 de ellas reveló un peso
neto promedio de 23.2 onzas y una desviación estándar de 0.3 onzas.

a) Estime la desviación estándar de la población a partir de la desviación estándar de la


muestra.
b) Estime el error estándar de la media de esta población finita.
c) ¿Cuáles son los límites superior e inferior del intervalo de confianza del peso neto
medio, si el nivel deseado de confianza es de 0.95? ¿Es verdadera la afirmación de
que el peso neto promedio de cada caja de cereal es de 24 onzas?.

2. Usted es el administrador del hotel Portales y quiere saber el número promedio de


huéspedes diarios para mejorar la atención. La siguiente tabla contiene el número de los
que se registraron cada 18 días seleccionados al azar.

61 57 53 60 64 57 54 58 63
59 50 60 60 57 58 62 63 60

a) Calcule la media y la desviación estándar muestral.


b) Encuentre un intervalo de confianza del 95% para la media poblacional.

3. Calcule un intervalo de confianza de 99% para la probabilidad de relojes defectuosos


producidos en un proceso de la fábrica Rolex que usted administra, cuando se halla que
una muestra de tamaño 200 contiene 16 relojes defectuosos.

4. Datos de archivo indican que la varianza de las mediciones efectuadas sobre la lámina
metálica grabada, las cuales fueron obtenidas por inspectores expertos en control de
2
calidad es de 0.18 plg . Las mediciones efectuadas por un inspector sin experiencia
podrían tener una varianza mayor o menor. Si usted, como nuevo inspector, mide 100
grabados con una varianza de 0.13 plg2, pruébese con un nivel de confianza del 95% si
usted realiza mediciones satisfactorias.

5. Usted es el gerente de Bolivisión y planea un estudio para determinar el tiempo promedio


que los niños de nivel preescolar ven la televisión, con el fin de hacer un cambio en su
programación. El estudio piloto indicó que el tiempo medio por semana es de 12 horas,
con una desviación estándar de 3 horas. Se desea estimar el tiempo medio de un cuarto

139
de hora. Se usará el grado de confianza de 0.95. ¿Cuántos niños de nivel preescolar
deben incluirse en la investigación?.

6. Usted está estudiando la eficiencia de dos máquinas que producen láminas de cartón.
Para ello seleccionó dos muestras aleatorias de tamaño n = 10 y m = 15,
respectivamente. Las medias y varianzas muestrales son: x1 = 5.0 mm. s12= 0.5 mm2., x2
2 2
= 5.2 mm. s2 = 0.53 mm . Construya un intervalo de confianza del 95% para el cociente
de varianzas.

7. Usted, como gerente del restaurante Aurora, piensa adquirir un nuevo mobiliario. Para
decidir con mayores datos sobre la cantidad que puede invertir en mesas y sillas, desea
determinar el ingreso promedio por cliente. Muestreó aleatoriamente a 9 clientes, cuya
cuenta promedio resultó ser de 18.30 Bs. con una desviación estándar de 3.60 Bs.
Construya un intervalo de confianza de 95% para el monto de la cuenta promedio por
cliente.

8. En una muestra para una inversión de mercados, en la cual 64 compradores fueron


contactados, se encontró que el 72% de todas las compras de productos alimenticios
distribuidas nacionalmente, fueron motivadas por la publicidad del producto.

a) Estime el error estándar de la proporción de compras motivadas por la publicidad.


b) Encontrar los límites de confianza superior e inferior para esta proporción, dado un
nivel de confianza de 0.90.

9. Una empresa que fabrica cigarrillos en la que usted es el diseñador de la publicidad,


afirma que su marca A se vende más que su marca B en 8%. Si se halla que 42 de 200
fumadores prefieren la marca A y 18 de 150 prefieren la marca B, calcular un intervalo de
confianza de 94% para la diferencia entre las proporciones de ventas de las dos marcas,
y decida si la diferencia de 8% es una afirmación válida.

10. Una máquina expendedora de refresco gaseoso del local que usted administra, se
regula de modo que la cantidad de bebida que sirve está distribuida en forma
aproximadamente normal, con una desviación estándar igual a 0.15 decilitros.

a) Calcule un intervalo de confianza de 95% para la media de todas las bebidas


despachadas por esta máquina, si una muestra aleatoria de 36 servicios presenta un
contenido promedio de 2.25 dl.
b) ¿Qué tan grande necesita ser la muestra si se desea tener una confianza de 95% de
que la media de la muestra esté dentro de 0.09 dl. de la media verdadera?

11. Se disponen de los siguientes datos de las calificaciones de un docente de Estadística:

1er Parcial 70 20 95 5 15 35 40 55 0 40 10
2do Parcial 25 15 95 70 80 50 85 15 10 5 50

a) Efectúe una estimación de las varianzas poblacionales del 1er y del 2do parcial.
b) El docente cree que como las notas provienen del mismo curso las varianzas son
iguales. ¿Es razonable su suposición?. Use un nivel de confianza del 90%.

140
c) Si las notas mejoran sustancialmente de un parcial al otro el docente llevará a los
alumnos a un viaje de estudios a Santa cruz. Encuentre el intervalo de confianza
para la mejora de notas con un nivel de significancia del 10%. Responda si cree que
los estudiantes merecen el viaje.

12. Se preparan dos tandas de cemento, y de cada una se fabrica un gran número de
tabiques. Se toma una muestra de 6 tabiques de cada tanda, y la fuerza de tensión el
libras/pulgada2, se mide para cada tabique de las dos muestras. Suponiendo
distribución normal obtenga un intervalo de confianza de 95% para la razón de las dos
σ1
desviaciones típicas .
σ2
Tanda 1. ∑ x = 3216, ∑ x
i i
2
= 1730088
Tanda 2: ∑ y = 3297, ∑ y
2
i i = 1812339

¿Hay evidencia para creer que las desviaciones son distintas?

13. Un estudio demostró que 74 de 200 personas que vieron un desodorante anunciado
durante la transmisión de un partido de fútbol y 86 de otras 200 que lo vieron
anunciado en un programa de variedades recordaban el nombre dos horas más tarde.
Calcule un intervalo de confianza del 95% para la diferencia de las proporciones. E
interprete el resultado. ¿Cuál medio es mas efectivo?

14. Como investigador de mercados, de una gran compañía de aparatos electrónicos de


consumo, quisiera estudiar las costumbres de ver televisión de los residentes en una
ciudad pequeña en particular. Para el efecto seleccionó una muestra aleatoria de 40
entrevistados y a cada uno de ellos les dio instrucciones de mantener un registro
detallado de todos los programas de televisión que vieran en determinada semana. Los
resultados fueron los siguientes:

Cantidad de televisión vista en la semana: Media: 15.3 horas. Desviación estándar: 3.8
horas. 27 entrevistados vieron el noticiero de la noche, por lo menos tres noches
durante la semana.

a) Estime un intervalo de confianza del 95% para la cantidad promedio de televisión


vista cada semana en esta ciudad.
b) ¿Qué tamaño de muestra requeriría si se deseara una confianza del 95% de estar
en lo correcto en una escala de 2 horas y suponiendo que la desviación estándar de
la población es de 5 horas?
c) Estime un intervalo de confianza para la proporción de entrevistados que vieron el
noticiero de la noche en por lo menos tres noches cada semana.
d) ¿Qué tamaño de muestra se necesita si desea tener una confianza del 95% de estar
dentro de 0.035 de la proporción real que ve el noticiero de la noche, en por lo
menos tres noches de la semana, si no cuenta con estimaciones anteriores?

15. Usted, como dueño de la compañía de aparatos de audio Play-It-Again, ofrece un año
de garantía en todos los estéreos que vende su compañía. Para los 26 aparatos a los
que se les dio servicio de garantía el año anterior, el costo promedio de compostura fue
141
de 75$ y la desviación estándar de la muestra fue de 15$. Usted, ha decidido, que a
menos que la desviación estándar real sea menor que 20$, comprará sus aparatos de
audio a otro mayorista.

a) Calcule un intervalo de confianza del 90% que le ayude a tomar una decisión al
respecto.
b) ¿Usted deberá cambiar de proveedor?

16. En 1978, la Agencia para la Protección Ambiental de E. U. estableció un máximo nivel


de ruido de 83 decibeles para camiones pesados. Se podría interpretar este límite de
varias maneras. Una forma de aplicar el límite sería exigir que todos los camiones se
ajustaran al límite de ruido. Un segundo método, pero menos satisfactorio, sería exigir
que el nivel promedio del ruido de la flotilla de camiones fuera menor que el límite. Si se
tornara como regla lo último, la variación en el nivel de ruido de un camión a otro sería
importante porque un valor grande de la varianza significaría que muchos camiones
excederían el límite, aunque el nivel promedio de la flotilla fuera de 83 decibeles. Los
datos para 6 camiones eran:

82.4 83.8 83.1 82.3 81.8 83.0

Utilice esos datos para conformar un intervalo de confianza de 90% para la variación de
las lecturas de la emisión de ruido de los camiones. Si la variación de estas lecturas
sobrepasa el valor de 3, se elegirá el primer método. Con base en la información que
nos da los valores del intervalo hallado, ¿Cuál de los dos métodos se elegirá?

17. En un experimento realizado en la compañía Ford, se comparó la economía de


combustible en dos tipos de autos con motor a gasolina, equipados en forma
semejante. Suponga que 13 autos de tipo A y 10 de tipo B se utilizaron en pruebas de
velocidad constante de 90 km/h. Si los 13 autos de tipo A promediaron 16 km/h, con
una desviación estándar de 1.0 km/h y los 10 autos de tipo B promediaron 11 km/h, con
una desviación estándar de 0.8 km/h.

a) Determinar un intervalo de confianza de 98% para σ1/σ2 que son las desviaciones
estándar para los recorridos por litro de combustible para los vehículos de tipo A y de
tipo B, respectivamente.
b) Hallar el intervalo con una probabilidad del 90%.

18. Recientemente, la Dirección General de la Renta tomó una muestra de 200


devoluciones de impuestos y encontró que el reembolso promedio de impuestos de la
muestra llegaba a 425.39 $us, con una desviación estándar de la muestra de 107.10
$us.

a) Estime el reembolso medio de impuestos de la población y la desviación estándar de


la población.
b) Utilizando las estimaciones hechas en el inciso anterior, construya un intervalo en el
que se tenga 95% de certeza de que la media de la población estará en él.

19. El director administrativo de un colegio con 2400 estudiantes, desea usar la media de
una muestra aleatoria para estimar la cantidad promedio de tiempo que tardan los
142
alumnos en ir de una clase a la siguiente, y además quiere poder asegurar con una
confianza del 99% que el error es a lo más 0.25 minutos. El director sabe por
experiencia que la desviación del tiempo que tardan sus alumnos de ir de una clase a
otra es de 1.4 minutos. ¿Qué tamaño debe tener la muestra?

20. Las opiniones de un gerente de ventas sobre la demanda mensual promedio de uno de
los productos de su compañía podrían ser descritas por medio de una distribución
normal con media 3800 unidades y una desviación de 260 unidades.

a) ¿Qué probabilidad está asignándose al hecho de que la verdadera demanda media


mensual esté en el intervalo de 3500 a 4000 unidades?
b) Si los datos para 9 meses muestran una demanda promedio de 3702 unidades, con
una desviación estándar de 390 unidades, ¿cómo afecta esta información a la
probabilidad determinada en a)?

21. Supóngase que se desea estimar la proporción real de unidades defectuosas en un


cargamento muy grande de ladrillos de adobe y que se necesita una confianza al
menos del 95% de que el error sea a lo sumo 4%. ¿De qué tamaño debe ser la muestra
si

a) No se tiene idea de cómo podría ser la proporción muestral.


b) Se sabe que la proporción real no excede a 0.12.
c) Repita los dos anteriores incisos si la población de ladrillos es de 50000.

22. Una organización de investigación de consumo selecciona de manera rutinaria varios


modelos de automóvil cada año y evalúa su eficiencia con respecto al combustible. En
el estudio del presente año, de dos modelos compactos fabricados por dos marcas
distintas, el consumo promedio para doce automóviles de la marca A fue de 27.2 millas
por galón (mpg) con una desviación estándar de 3.8 mpg. Los nueve automóviles de la
marca B que fueron probados tuvieron un número de 32.1 mpg, con una desviación
estándar de 4.3 mpg. Con un porcentaje de confianza del 90%, ¿se deberá concluir
que los automóviles de la marca B tiene un número promedio de millas por unidad de
combustible mayor que los automóviles de la marca A?

143
EJERCICIOS PARA EXAMEN

DECISIONES DE LA GERENCIA DE PRODUCCIÓN


DE UNA INDUSTRIA DE CUERO

Usted es el administrador de producción de una fábrica que produce artículos de cuero en


general. Las especificaciones de su puesto incluyen la dirección de las 5 Ps en la línea de
producción:

• Personas (Fuerza de trabajo, directa o indirecta).


• Plantas (Fábricas o ramas de servicio donde se realiza la producción).
• Partes (Materiales o suministros que pasan por el sistema).
• Procesos (Pasos para lograr la producción y maquinaria).
• Planificación y control (Procedimientos e información para manejar el sistema).

Cada día tiene que resolver múltiples problemas y realizar muchas decisiones que afectan a
la productividad de la empresa. Para ello ha montado un departamento de Estadística y
Control de calidad, ya que anteriormente se hacían decisiones que no estaban basadas en
métodos técnicos, sino en la experiencia del anterior gerente de producción.

Se presentaron varios problemas en esta época del año, cada uno catalogado mediante las
5 Ps.

1. Personas.

Como invierno es una época alta para chamarras de cuero con frisa de lana, el personal de
planta de producción no es suficiente para cubrir la demanda, así que Ud contrató a
personal eventual para cubrirla, teniendo ya no uno, sino dos turnos de trabajo. El primero
trabaja de 8:00 – 12:00 y de 14:00 – 18:00 y el segundo de 20:00 – 24:00 y de 1:00 – 5:00.
Sin embargo, el técnico de producción, dependiente de Ud., le ha enviado un reporte donde
cree que el ritmo promedio de trabajo del segundo turno es significativamente inferior al del
primer turno y la variabilidad superior al del primer turno. Junto con el reporte, le envió los
siguientes datos muestrales, de 10 días de trabajo, que corresponden al número de
chamarras de cuero que produjeron por día:

1 Turno 11 14 16 12 9 10 13 15 14 10
2 Turno 8 7 6 10 5 7 12 11 8

144
Lamentablemente por negligencia del técnico, Ud, no posee el dato de la producción del
último día del segundo turno.

a) ¿Con una certeza del 95%, la variabilidad del ritmo de trabajo del segundo grupo es
significativamente superior al del primer grupo?

b) Tomando en cuenta el resultado del inciso a), compruebe si la producción diaria


promedio del segundo grupo es significativamente inferior al del primer grupo, con la
misma certeza de confianza.
c) Si la suposición del técnico de producción es cierta, en cuanto al ritmo promedio de
trabajo, se realizará un programa de entrenamiento a todo el personal del segundo
grupo, sobre metodologías de economía de los movimientos. ¿Qué hará?

2. Plantas y procesos.

La empresa, desde hace varios años, quiere implementar una línea de maletines para
computadoras portátiles (lap top), dada la creciente demanda en el mercado. Sin embargo,
la tecnología para fabricarlas debe ser de última generación, particularmente en lo que
respecta al ensamblado de los refuerzos metálicos con las partes de cuero que las
recubren. Para ello, se piensa montar una línea de producción nueva y comprar una
computadora y cortadora, con las cuales realizar el cortado de las piezas de cuero
automáticamente, mediante el CAD-CAM (Diseño y manufactura asistidas por
computadora). Sin embargo, para la compra de esta nueva tecnología y el posterior
montaje, existen dos problemas:

a) Elegir las maquinarias con el mejor performance para la industria del cuero. En este
sentido existen dos proveedores que calificaron en la primera selección que realizó el
encargado de compras. Para la decisión final se pidió a los proveedores que permitan
que se realice un muestreo para determinar el porcentaje de los cortes que caen dentro
de especificación realizados por sus máquinas. Los datos se muestran en la siguiente
tabla:

Estadísticos Proveedor Proveedor


1 2
Tamaño muestral 150 170
Número de cortes 80 130
dentro de especificación

¿De qué proveedor le conviene comprar el nuevo paquete tecnológico? Ud quiere


determinar esta importante compra, con un porcentaje de confianza de 99%.

b) Una vez elegida la mejor maquinaria, ajustar la homogeneidad de los cortes (la
precisión), ayudados por el experto que mandó el proveedor para ponerla en marcha.
Éste, afirma que la maquinaria viene calibrada de modo de que la variabilidad en los
cortes no sea mayor a 0.005 cm2., lo cual es conveniente para el proceso. Para ello, Ud
mandó a realizar un muestreo de 8 cortes de una pieza de cuero que debía medir 5 cm.
de ancho. Los resultados son:

145
5.02 4.98 5.04 5.01 5.00 4.97 5.02 4.99

Con base en los resultados muestrales y no queriendo tener un riesgo mayor al 2% en la


estimación, ¿la afirmación del experto es correcta?

c) Si la afirmación del experto no es correcta, Ud. deberá presentar ante él su


disconformidad y pedir que la recalibre. ¿Qué hará?

3. Partes y Planificación y Control.

Actualmente se compra el cuero para las distintas líneas de producción en el Beni, de varios
proveedores ganaderos: Vacadiez, Peredo, Gendrich y Gonzales. Cada uno de ellos,
anualmente abastece a la empresa de 5000, 3500, 7000 y 10000 cueros. El contrato con
estos proveedores se renueva cada año, para asegurar que la calidad del cuero no
disminuya. Este año Ud. quiere determinar qué proveedores calificarán. Para ello debe
estimar la superficie promedio de cuero bien curtido y sin imperfecciones de cada uno de
ellos. Por experiencia Ud. sabe que las desviaciones estándar de cada proveedor son de
0.2, 0.4, 0.1 y 0.35 m2, respectivamente.

a) ¿Cuántos cueros de cada proveedor deberá analizar con el fin de tener el 94% de
confianza de que la superficie promedio de cuero bien curtido y sin imperfecciones esté
2
dentro 0.1 m con respecto a la media real?

b) El anterior año, la superficie promedio por cuero bien curtido y sin imperfecciones era de
2
1 m . ¿Qué proveedores califican para este año, si después de realizado el muestreo se
tienen las medias respectivas de los distintos proveedores: 1.05, 1.30, 1.50 y 1.08?

c) Si más de dos proveedores no califican, Ud deberá planificar y lanzar una licitación en el


próximo mes, para conseguir nuevos proveedores para la provisión de cueros y realizar el
mismo control a la materia prima que realizó con sus proveedores actuales, ya que podría
quedar sin los suficientes suministros para abastecer la demanda. Caso contrario, antes
de renovar el contrato, exigirá a los que no calificaron mayor calidad en los cueros que
proveen, previa comprobación por muestreo, luego de un tiempo fijado por ambas partes
¿Cuál es su decisión?

Por experiencia usted sabe que en todos los problemas que quiere resolver, las muestras
tomadas provienen de poblaciones aproximadamente normales.

146
CAPÍTULO 5

PRUEBAS DE HIPÓTESIS

1. INTRODUCCIÓN

Por medio de las pruebas de hipótesis se trata de determinar cuándo es razonable concluir,
a partir del análisis de una muestra, que la población entera posee determinada propiedad,
y cuando no es razonable llegar a tal conclusión.

La prueba de hipótesis comienza con una suposición, denominada hipótesis, que se hace
en torno a un parámetro de la población. Después se reúnen datos muestrales, se
producen estadísticos de la muestra y a partir de esta información se decide, con una
probabilidad dada, si el parámetro supuesto de la población es correcto.

No se puede aceptar ni rechazar una hipótesis referente a un parámetro de la población por


mera intuición. Por el contrario, se necesita aprender a decidir con objetividad, basándose
en la información muestral, si se acepta o se rechaza un presentimiento.

2. CONCEPTOS BÁSICOS DEL PROCEDIMIENTO DE LA PRUEBA DE


HIPÓTESIS.

Hay un procedimiento de 5 pasos para probar una hipótesis.

Paso 1. Plantear la hipótesis nula y la alternativa.

El primer paso es plantear la hipótesis que se probará, denominada hipótesis nula,


designada mediante Ho. La hipótesis nula se plantea con el objetivo de aceptarla o
rechazarla. Tal hipótesis es una afirmación que se aceptará si los datos muestrales no
pueden proporcionar evidencia convincente de que es falsa. Generalmente esta hipótesis
proviene de datos históricos, encuestas pasadas o suposiciones que los expertos pueden
hacer de algún valor que es susceptible de cambiar.

La hipótesis alternativa es una afirmación o enunciado que se aceptará si los datos


muestrales proporcionan amplia evidencia de que la hipótesis nula es falsa. Se la designa
por H1.

Ejemplo.

En la UPB existe la hipótesis de que los alumnos de cursos numerosos (más de 30


alumnos) tienen menor aprovechamiento académico.

La hipótesis nula será: Los alumnos de cursos numerosos tienen igual aprovechamiento
académico que los alumnos de cursos con poco alumnado.

147
La hipótesis alternativa será: Los alumnos de cursos numerosos tienen menor
aprovechamiento que los alumnos de cursos con poco alumnado.

Paso 2. Seleccionar un nivel de significación o de riesgo.

La finalidad de la prueba de hipótesis no es poner en tela de juicio el valor calculado del


estadístico muestral, sino emitir un juicio sobre la diferencia existente entre él y un supuesto
parámetro de la población.

El nivel de significación es la probabilidad o el riesgo de rechazar la hipótesis nula cuando


en realidad es verdadera. Se denota mediante la letra α.

El investigador debe decidir el nivel de significación antes de formular una regla de decisión
y recopilar datos muestrales.

Se pueden cometer dos tipos de errores: El error tipo I (error α), es la probabilidad de
rechazar la hipótesis nula, cuando en realidad es verdadera. El error tipo II (error β) es la
probabilidad de aceptar la hipótesis nula cuando en realidad es falsa.

El cuadro siguiente muestra esquemáticamente los tipos de errores en los que puede
incurrir un investigador y sus consecuencias:

Hecho/Decisión El Investigador
Acepta H0 Rechaza H0
Si H0 es verdadera Decisión correcta Error tipo I
y
Si H0 es falsa y Error tipo II Decisión correcta

Se adoptan valores del 1 al 5% para el nivel de significancia. El investigador debe estar


conciente que cuanto más alto sea este valor, habrán mayores posibilidades de que
rechace una hipótesis nula que sea verdadera.

Paso 3. Identificar el estadístico de prueba.

Existen muchas estadísticas de prueba. Se utilizarán la t, χ2, z, y otras, dependiendo del


parámetro de la población que se ha planteado como hipótesis. Un estadístico de prueba es
un valor, determinado a partir de la información muestral, que se utiliza para aceptar o
rechazar la hipótesis nula.

Paso 4. Formular una regla de decisión.

Una regla de decisión es una afirmación de las condiciones bajo las que se acepta o
rechaza la hipótesis nula. Para lograr esto, la distribución muestral se divide en dos partes;
la región de aceptación y la de rechazo. El área de rechazo define la ubicación de todos los
valores que son demasiado grandes o demasiado pequeños, por lo que la probabilidad de
que ocurran según una hipótesis nula verdadera es muy remota.

148
Se define el valor crítico como el número divisorio entre la región de aceptación y la región
de rechazo, el cual se puede determinar mediante una tabla de la distribución muestral que
se está considerando para la prueba.

Paso 5. Tomar una muestra y llegar a una decisión.

El último paso en la prueba de hipótesis es la toma de la decisión de aceptar o rechazar la


hipótesis nula, comparando el valor del estadístico de prueba con el valor crítico
determinado. Dependiendo de la región en la que ha caído el estadístico, es que se toma la
decisión de aceptar o rechazar la hipótesis nula.

3. PRUEBA DE SIGNIFICACIÓN DE UNA Y DE DOS COLAS

Una prueba de hipótesis de dos extremos rechazará la hipótesis nula si la media muestral
es significativamente más alta o más baja que la supuesta media de la población. Por lo
tanto existen dos regiones de rechazo. La hipótesis nula y la alternativa serían:

H0: µ = µ0

H1: µ ≠ µ0

Sin embargo, se dan situaciones donde no conviene aplicar una prueba de dos extremos,
sino de un extremo. La hipótesis nula y la alternativa serían:

H0: µ = µ0

H1: µ > µ0 Prueba de extremo derecho o superior


H1: µ < µ0 Prueba de extremo izquierdo o inferior

Por último, se puede recordar lo siguiente: en cada ejemplo de la prueba de hipótesis,


cuando se acepta una hipótesis nula basándose en la información de la muestra, realmente
se está afirmando que se carece de datos estadísticos para rechazarla. Esto no quiere decir
que la hipótesis nula sea verdadera en forma contundente, ya que para ello se necesitaría
conocer el parámetro poblacional.

4. PRUEBAS DE HIPÓTESIS

4.1. Pruebas de hipótesis para medias

A continuación se estudia el método para realizar pruebas de hipótesis para la media de


una población normal. Se considerará primero los dos casos más frecuentes, en donde las
varianzas de la población sean o no conocidas, y luego mediante un diagrama de árbol se
verán todos los casos que pueden darse.

Primer paso. Las hipótesis nula y alternativa son:

149
H0: µ = µ0

H1: µ ≠ µ0; µ > µ0; µ < µ0

El tipo de hipótesis alternativa, se elige de acuerdo a las especificaciones del problema.


Segundo paso. Se elige el nivel de riesgo.

α = 0.05

El valor de 5%, es el más usado y aceptado por los investigadores.

Tercer Paso. Se elige el estadístico de prueba adecuado. Dependiendo del caso, pueden
elegirse lo siguientes estadísticos:

x − µ0
• Con varianza conocida (n>30): Z=
σ n
x − µ0
• Con varianza desconocida (n<30): t=
S n

Más adelante se mostrará el árbol de decisiones para elegir el estadístico, considerando


todos los casos posibles, y con este instrumento clave, se realizará un ejemplo.

Cuarto Paso. Se establece la regla de decisión. Dependiendo del estadístico de prueba


elegido y de la hipótesis alternativa planteada se tendrán pruebas de dos o una cola:

• Con varianza conocida (n>30).

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2

Las regiones de rechazo son las pintadas y las de aceptación las blancas.

• Con varianza desconocida (n<30).

α 1−α α 1−α 1−α


2 2
α α

− t α , n −1 t α , n −1 t t α , n −1 t − t α , n −1 t
2 2

Quinto paso. Con los datos muestrales, se halla el valor del estadístico de prueba y se lo
ubica en el gráfico que posee la regla de decisión. Dependiendo en que zona se ubica el
valor, se decide rechazar o aceptar la hipótesis nula.
150
A continuación se presenta el árbol de decisiones para elegir el estadístico adecuado.

151
ÁRBOL DE DECISIÓN PARA LA PRUEBA DE HIPÓTESIS

DE LA MEDIA DE LA POBLACIÓN

Utilice este estadístico de prueba:

Cualquier n x − µ0
Si Z=
σ n
Grande
x − µ0
No n>30 Z=
s n
Pequeño
Normal n<30 x −µ0
t=
s n
Grande
x − µ0
Si n>20 Z=
No Normal σ n
Pequeño
Forma de la
n<20
población
x − µ0
K=
Grande σ n
No n>50
x − µ0
¿Se conoce la varianza de la Z=
Pequeño s n
población?
n<50
¿Tamaño de la
muestra? Callejón sin salida! No hay prueba de
hipótesis conocida.

152
153
Ejemplo.

Usted es el administrador de un lugar exclusivo para ir a tomar café, llamado Coffe Only.
Una máquina que llena frascos de Capuchino funciona correctamente si, en promedio,
estos llevan 500 gramos de café. Usted sospecha que esta máquina ha estado fallando,
puesto que muchos clientes han manifestado que el Capuchino no estaba en su punto.
Para corroborar este hecho seleccionó una muestra de 16 frascos. Obtuvo la siguiente
información muestral: x = 496 gr. y s = 5 gr. Considerando que la cantidad de café en cada
frasco sigue una distribución normal, y eligiendo el nivel de significancia de 0.05, pruebe si
está funcionando adecuadamente la máquina o no.

Resolución.

Paso 1: Se establece la hipótesis nula y alternativa.

H0: µ = 500 gr.

H1: µ ≠ 500 gr.

Como solo se quiere probar si la máquina está llenando bien o no, esta es una prueba de
dos colas.

Paso 2: Se elige el nivel de riesgo.


α = 0.05

Paso 3: Se elige el estadístico de prueba adecuado, mediante el árbol de decisión.

La forma de la población es normal, no se conoce la varianza de la población y el tamaño


de muestra es menor a 30. Por lo tanto el estadístico según el árbol de decisiones es:

x − µ0
t=
S n

Paso 4: Se establece la regla de decisión.

Región de
aceptación

Región de Región de
rechazo 0.025 0.025 rechazo

− t 0.025 ,15 t 0.025,15 t


− 2.131 2.131

Como la hipótesis nula es que el parámetro sea distinto a un valor, la prueba es de dos
colas.

Paso 5: Se halla el valor de t y se realiza la decisión.


154
496 − 500
t= = −3.2
5 16

Como este valor cae en la región de rechazo, se concluye que la hipótesis nula debe ser
rechazada y se acepta la hipótesis alternativa, que indica que los frascos no están siendo
llenados con 500 gr. de café.

Conclusión: En promedio la máquina no está llenando los frascos correctamente con 500
gr. de café.

Acción: Como administrador debe ordenar un mantenimiento o calibración de la máquina.

4.2. Pruebas de hipótesis para la diferencia de dos medias

Se considera ahora dos poblaciones normales de las que se realizará una comparación de
sus medias mediante la diferencia. Se estudiarán primero los tres casos más frecuentes,
para luego presentar el árbol de decisiones para todos los casos.

Primer paso.
H0: µ1 = µ2
H1: µ1 ≠ µ2; µ1 > µ2; µ1 < µ2

Segundo paso.
α = α0
Tercer Paso.

• Con varianzas conocidas y cualquier tamaño de muestra:

Z=
(X 1 − X2 ) − (µ1 − µ 2 )
σ12 σ 22
+
n1 n 2

• Con varianzas desconocidas pero iguales (n<30):

t=
(X
1 − X 2 ) − (µ 1 − µ 2 )
S=
(n1 − 1)S12 + ( n 2 − 1)S22
ν = n1 + n2 − 2
1 1 n1 + n 2 − 2
S +
n1 n2
• Con varianzas desconocidas y no necesariamente iguales (n<30).

155
2
 S12 S 22 

t=
(X 1 − X 2 ) − (µ 1 − µ 2 )  + 
 n1 n 2 
ν= −2
S12 S22
+
n1 ) (S 22 n 2 )
+
(S 2
1
2 2

n1 + 1
n1 n 2 n2 + 1
• Con datos apareados (muestras dependientes) (n<30).

(x1 − x 2 ) − (µ1 − µ 2 ) x − µ0
t= ó t=
n S n
∑ (x
i =1
1 − x 2 ) 2 − n(x1 − x 2 ) 2

n −1

Cuarto Paso.

• Con varianzas conocidas y cualquier tamaño de muestra:

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2

Rechazo Rechazo Rechazo Rechazo

• Con varianzas desconocidas pero iguales o no necesariamente iguales, y muestras


apareadas (n<30):

α 1−α α 1−α 1−α


2 2
α α

−tα ,ν tα ,ν t tα ,ν t −tα ,ν t
2 2

Rechazo Rechazo Rechazo Rechazo

La diferencia entre las reglas de decisión de las dos pruebas de hipótesis planteadas
radicará en el valor de los grados de libertad.

Quinto paso.

Con los datos muestrales, se halla el valor del estadístico de prueba y se lo ubica en el
gráfico que posee la regla de decisión. Dependiendo en que zona se ubica el valor, se
decide rechazar o aceptar la hipótesis nula.

156
A continuación se presenta el árbol de decisiones para elegir el estadístico adecuado.

157
ARBOL DE DECISIÓN PARA PRUEBAS DE HIPÓTESIS

DE LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES

Utilice este estadístico de prueba:

No 1
(X − X2 ) − (µ1 − µ 2 )
Z=
Cualquier n No σ12 σ 22
+
n1 n 2

No (X 1 − X 2 ) − ( µ1 − µ2 )
Z=
No s12 s22
Grande +
n1 n 2
Si x − µ0
Z=
Si Si S n

Si x − µ0
n>30 t=
S n

(X 1 − X2 ) − (µ 1 − µ 2 ) (n1 − 1) s12 + ( n2 − 1) s22


No Si t= s=
1 1 n1 + n2 − 2
Si S +
n1 n2 ν = n1 + n2 − 2

¿Varianzas de
n<30
las poblaciones
conocidas? Pequeño No 2
 s12 s22 
 + 
(X n n
¿Tamaño de las 1 − X 2 ) − ( µ1 − µ 2 ) ν =  12 2  2 − 2
No t= 2
muestras? ¿Datos S12 S22
 s1   s22 
   
pareados? +  n1  +  n2 
¿Varianzas n1 n 2 n1 + 1 n2 + 1
Iguales?

158
Ejemplo.

Se estudian dos métodos para el aprendizaje del idioma Inglés. Después de cierto periodo,
dos grupos, cada uno llevando uno de estos métodos, son examinados mediante un mismo
test. Los resultados muestrales obtenidos son:

Estadísticos Grupo 1 Grupo 2


Media 87 92
Varianza 36 23
Tamaño 10 16

Con base en esta información, ¿es posible afirmar que el método utilizado en el grupo 2 es
más efectivo? Se puede asumir que las varianzas poblacionales de los dos grupos son
iguales y que se distribuyen normalmente. Utilice un nivel de significancia de 0.01.

Resolución.

Paso 1:
H0: µ1 = µ2

H1: µ1 < µ2

Paso 2:
α = 0.01

Paso 3:

Usando el árbol de decisiones, como las varianzas son desconocidas, los tamaños de
muestra pequeños, pero las varianzas son iguales, se tiene:

t=
(X
1 − X 2 ) − (µ 1 − µ 2 )
S=
(n
1 − 1)S12 + ( n 2 − 1)S22
1 1 n1 + n 2 − 2
S +
n1 n2
ν = n1 + n2 − 2

Cuarto Paso.

α = 0.01 ν = 10 + 16 − 2 = 24
1 − α = 0.99
t
−t0.01,24 = −2.49
Rechazo

159
Quinto paso.

S=
(10 − 1) 36 + (16 − 1) 23 = 5.28 t=
(87 − 92 ) = −2.35
24 1 1
5.28 +
10 16

El valor de t está en la región de aceptación y por lo tanto se acepta la hipótesis nula.

Conclusión: No existe evidencia estadística suficiente para rechazar la hipótesis nula, así
que los métodos de Inglés no difieren significativamente.

Acción: Los alumnos pueden inscribirse a cualquiera de los métodos o los profesores
pueden enseñar con cualquiera de ellos, porque el resultado será el mismo.

4.3. Prueba de hipótesis para una proporción cuando se toman muestras


grandes

El único caso que puede sustentar la estadística, cuando se quiere realizar una inferencia
para una proporción, es cuando se toman muestras grandes. Este proceso aleatorio sigue
una distribución binomial, que deberá aproximarse a una normal.

A continuación se definen los elementos, que entran en juego:

X= Número de artículos éxito de la muestra (Ej: productos defectuosos en un proceso


productivo)
n= Tamaño de la muestra
X
p= Fracción éxito (Ej: fracción defectuosa del proceso) =
p
Ahora, se siguen los 5 pasos de la prueba de hipótesis:

Primer paso.

H0: p = p0

H1: p ≠ p0; p > p0; p < p0

Segundo paso.

α = α0

Tercer paso.

X − np
Z=
np (1 − p )

160
Cuarto paso.

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2

Rechazo Rechazo Rechazo Rechazo

Quinto paso.

Basándose en la información muestral, se halla el estadístico de prueba, y se compara con


la regla de decisión. Luego se acepta o rechaza la hipótesis nula.

Ejemplo.

En un estudio de mercado, un investigador encontró que 43 mujeres de un grupo de 100


entrevistadas preferían el color rojo en sus automóviles. ¿Apoya esta muestra la afirmación
de que el 50% de las mujeres prefieren el color rojo en sus autos? Pruébelo al nivel 0.01.

Resolución.

Paso 1:
H0: p = 0.5

H1: p ≠ 0.5

Paso 2:
α = 0.01

Paso 3:
X − np
Z=
np(1 − p)

Paso 4:

0.005 0.99 0.005

−2.58 2.58 z
Rechazo Rechazo

161
Paso 5:
43 − 100(0.5)
Z= = −1.4
100(0.5) (1 − 0.5 )

El estadístico se halla en la región de aceptación, por lo tanto se acepta la hipótesis nula.

Conclusión: el 50% de las mujeres prefieren el color rojo en sus automóviles.

Acción: Puesto que este porcentaje es bastante considerable, el investigador deberá sugerir
a la compañía comercializadora que emplee la estrategia de mercadeo de mostrar primero
un auto rojo a los clientes femeninos.

4.4. Prueba de hipótesis para la diferencia entre dos proporciones

Ahora se analiza la prueba de hipótesis si se quieren comparar las proporciones de dos


poblaciones normales, tomando muestras grandes.

Los elementos a considerar son:

X1
p$ 1 = (Proporción éxito de la muestra tomada de la primera población)
n1
X
p$ 2 = 2 (Proporción éxito de la muestra tomada de la primera población)
n2

X1 + X 2
P= (Proporción promedio de ambas muestras)
n1 + n 2

Los cinco pasos para la prueba son:

Primer paso.

H0: p1 = p2

H1: p1 ≠ p2; p1 > p2; p1 < p2

Segundo paso.

α = α0

Tercer paso.

162
pˆ 1 − pˆ 2
Z=
1 1 
P (1 − P )  + 
 n1 n 2 
Cuarto paso.

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2
Rechazo Rechazo Rechazo Rechazo

Quinto paso.

Con los datos muestrales, se halla el valor del estadístico de prueba y se lo ubica en el
gráfico que posee la regla de decisión. Dependiendo en que zona se ubica el valor, se
decide rechazar o aceptar la hipótesis nula.

Ejemplo.

Una gran cadena hotelera está tratando de decidir si convierte más de sus habitaciones en
cuartos para no fumadores. En una muestra aleatoria de 400 huéspedes tomada el año
anterior, 166 de éstos pidieron habitaciones para no fumadores. Este año, 175 huéspedes
de una muestra de 380 prefirieron cuartos para fumadores. ¿Recomendaría usted que la
cadena de hoteles destine más habitaciones a no fumadores? Apoye su recomendación
probando la hipótesis apropiada a un nivel de significancia de 0.01.

Resolución.

Paso 1:

H0: p1 = p2 (Las proporciones para cuartos de no fumadores este año es igual a la del año
pasado)

H1: p1 < p2 (La proporción para los cuartos de no fumadores será mayor este año)

Paso 2:
α = 0.01

Paso 3:
pˆ 1 − pˆ 2
Z=
1 1 
P (1 − P )  + 
 n1 n 2 
Paso 4:
163
α = 0.01 1 − α = 0.99

− z0.01 = −2.58 z
Rechazo
Paso 5:

166 205 166 + 205


pˆ1 = = 0.415 pˆ 2 = = 0.5395 P= = 0.4756
400 380 400 + 380

0.415 − 0.5395
Z= = −3.48
 1 1 
0.4756 (1 − 0.4756 )  + 
 400 380 

El valor del estadístico cae en la región de rechazo, por lo tanto se acepta la hipótesis
alternativa.

Conclusión: La proporción de los huéspedes del hotel que piden habitaciones para no
fumadores fue significativamente mayor con respecto a la del año pasado.

Acción: Se recomienda que el hotel destine más habitaciones para no fumadores.

4.5. Pruebas de hipótesis para varianzas

A continuación se estudian las pruebas relacionadas a la varianza de una población normal,


considerando dos casos: tomando muestras grandes y muestras pequeñas.

Primer paso.
2 2
H0: σ = σ0
2 2 2 2 2 2
H1: σ ≠ σ0 ; σ > σ0 ; σ < σ0

Segundo paso.
α = α0
Tercer paso.

( n − 1)S2
• Con muestras pequeñas (n < 30): χ =
2
σ 20
S−σ
• Con muestras grandes (n ≥ 30): Z =
σ 2n
Cuarto paso.

• Con muestras pequeñas (n < 30):


164
1−α 1−α 1−α
α 2 α 2 α α

χ12− α ,n −1 χ α2, n−1 χ2 χ α2 , n −1 χ2 χ12−α ,n −1 χ2


2 2
• Con muestras grandes (n ≥ 30):

α 1−α α 1−α 1−α


2 2 α α

− zα zα z zα z − zα z
2 2
Rechazo Rechazo Rechazo Rechazo

Quinto paso.

Con la información muestral se procede a decidir si rechazar la hipótesis nula o aceptarla.

Ejemplo.

Con base en la experiencia pasada, el gerente de producción de una compañía llantera ha


determinado que si la desviación estándar de la población de la duración de las llantas no
es mayor a 3500 kilómetros, se considerará que el proceso funciona correctamente (está
bajo control). Al gerente le interesa sobre todo determinar si hay demasiada variabilidad en
la duración de las llantas producidas en lunes, con los resultados siguientes (en miles de
km.):

22.42 20.62 18.36 26.47 21.46 19.75 19.20 20.30 23.40 17.84 27.38 26.34 22.43
23.46 28.27 23.51 24.73

¿Existen pruebas suficientes de que el proceso esté funcionando correctamente? Use un


nivel de significancia del 5%.

Resolución.

Paso 1:
2 2
H0: σ = 12.25 (3.5 )

H1: σ2 > 12.25


Segundo paso.
α = α0
Tercer paso.

165
( n − 1)S2
χ2 =
σ 20
Cuarto paso.

0.95
α = 0.05

2
χ 0.05,16 = 26.3 χ2
Quinto paso.

x = 22.70
s = 3.18

χ2 =
(17 − 1) 3.182 = 13.2
3.5 2

Se acepta la hipótesis nula.

Conclusión: El proceso está funcionando correctamente.

Acción: El gerente no hará ningún cambio en la eficiencia del proceso.

4.6. Prueba de hipótesis para el cociente de varianzas

Esta prueba se la realiza para probar si las varianzas de dos poblaciones normales son
iguales o diferentes. Generalmente esta situación se da cuando se quiere comparar la
precisión de dos instrumentos de medición, la variación en las características de calidad de
un producto o la variación en los resultados de dos procedimientos de prueba. Todos estos
ejemplos tienen que ver con la homogeneidad o uniformidad de variabilidades.

Primer paso.
2 2
H0: σ1 = σ2

H1: σ12 ≠ σ22; σ12 > σ22; σ12 < σ22

Segundo Paso.
α = α0
Tercer paso.
s12
F= 2
s2

Cuarto Paso.

α 1−α α 1 − α166 1−α


α
2 2 α

F1− α ,n1 −1,n2 −1


2
Fα ,n1 −1,n2 −1 F Fα ,n1 −1, n2 −1 F F1−α ,n1 −1,n2 −1 F
2
Quinto paso.

Con la información muestral se procede a decidir si rechazar la hipótesis nula o aceptarla.

Ejemplo.

Un supervisor de control de calidad de una empresa fabricante de automóviles está


preocupado por la uniformidad del número de defectos en los automóviles que salen de la
línea de ensamblaje. Si una línea de ensamblaje tiene una variabilidad significativamente
mayor en el número de defectos, entonces es necesario introducir cambios. El supervisor
ha recogido los siguientes datos:

Estadístico Número de defectos


Línea de ensamblaje Línea de ensamblaje B
A
Media 10 11
Varianza 9 25
Tamaño de muestra 20 16

¿La línea de ensamblaje B tiene una variabilidad significativamente mayor en el número de


defectos? Use α = 0.10

Resolución.

Paso 1:
2 2
H0: σ1 = σ2
2 2
H1: σ1 < σ2

Paso 2:
α = 0.1
Paso 3:
s12
F=
s 22

Paso 4:

1 1
F0.9,19,15 = = = 0.54
0.9 F0.1,15,19 1.86
α = 0.1
167

F0.9,19,15 F
Paso 5:

9
F= = 0.36
25

Se rechaza la hipótesis nula.

Conclusión: La línea de ensamblaje B tiene una variabilidad mayor a la A en cuanto al


número de defectos.

Acción: El supervisor introducirá cambios en la línea de ensamblaje B para reducir la


variabilidad.

5. ÁRBOL DE DECISIÓN PARA LA ELECCIÓN DE LA PRUEBA DE HIPÓTESIS


ADECUADA EN LA RESOLUCIÓN DE PROBLEMAS

En este capítulo se ha tratado de analizar y estudiar exhaustivamente todas las pruebas de


hipótesis que se pueden usar en el campo de la investigación usando la estadística
inferencial. Sin embargo, se propone a continuación un árbol de decisiones que servirá
como una guía didáctica para que el lector pueda elegir con mayor facilidad el tipo de
prueba para la resolución de problemas, tanto los que se presentan en el curso de
estadística inferencial como los que tiene que resolver un profesional en su empresa.

168
ÁRBOL DE DECISIÓN PARA ELEGIR LA PRUEBA DE HIPÓTESIS

ADECUADA EN LA RESOLUCIÓN DE PROBLEMAS

Media (Árbol de decisión)


Promedio
Medio ( n − 1) S2
2
χ =
Variación n<30 σ 20
Variabilidad
Varianza
S−σ
n>30 Z=
Fracción σ 2n
Porcentaje
Una
Probabilidad
Proporción
X − np
Z=
np (1 − p )
Comparación Diferencia de medias (Árbol de decisión)
Dos de promedios

¿Número de Relación de
poblaciones? variabilidades s12
Cociente de varianzas F= 2
s2
Comparación
de fracciones
o porcentajes pˆ 1 − pˆ 2
Diferencia Z= X1 + X2
de proporciones P=
1 1  n1 + n 2
¿Cuál es la P (1 − P )  + 
palabra clave?  n1 n 2 

169
EJERCICIOS DE CLASE

Aclaración: En todos los problemas que se presentan a continuación, se hace la suposición


de que las muestras extraídas provienen de poblaciones aproximadamente normales.

Prueba de hipótesis para la media de una población normal con varianza conocida
(n≥30).

1. Un vendedor de coches nuevos calcula que su compañía tiene que promediar mas de
4.8% de ganancias en las ventas de los autos nuevos asignados. Una muestra aleatoria
de 80 coches, proporcionó una media de 4.87% del porcentaje de ganancias por
vehículo. Por datos históricos del vendedor se sabe que la desviación estándar es de
3.9%. ¿Aportan los datos evidencia suficiente que indique que la política del gerente de
ventas al aprobar los precios genera una ganancia media superior a 4.8% por coche?
Use α = 0.01.

Prueba de hipótesis para la media de una población normal con varianza desconocida
(n<30).

2. Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con
el propósito de reducir el mismo para un motor eléctrico en particular a menos de 3000
motores por día. Se llevó a cabo un muestreo del inventario en reserva al final de cada
uno de 8 días, seleccionados aleatoriamente. Los resultados se muestran en la siguiente
tabla. ¿Con los datos, hay evidencia suficiente que señale que el promedio del número
diario de motores en el inventario es menor que 3000? Use α = 0.05.

Número de motores: 2905 2725 2835 3065 2895 3005 2835 2605

Prueba de hipótesis para la diferencia entre dos medias para una población normal
con varianzas conocidas (tomando muestras grandes).

3. Una compañía desea comparar las expectativas salariales anuales de su personal de


ventas femenino y masculino, según un nuevo plan de compensaciones ventas-mas-
comisión. Se pidió a 40 vendedoras y 40 vendedores, muestreados al azar, predijeran
sus ingresos anuales bajo el nuevo plan. Las medias muestrales y las desviaciones
poblacionales eran:

x1 = 310.83 $ x 2 = 297.45 $
σ1 = 23.12 $ σ 2 = 25.69 $

¿Proporcionan los datos evidencia que indique una diferencia en el promedio del ingreso
anual esperado tanto entre los vendedores como las vendedoras? Haga la prueba con α
= 0.1.

170
Prueba de hipótesis para la diferencia entre dos medias para una población normal
con varianzas desconocidas y no necesariamente iguales (tomando muestras
pequeñas).

4. Se estudian dos fórmulas para obtener la resistencia de un plástico utilizado en la


fabricación de juguetes. El experto industrial afirma que no hay diferencia significativa en
las resistencias promedio que dan cada una de las fórmulas. Se duda de su afirmación, y
se experimenta, obteniéndose la siguiente información.

Resistencia

Fórmula 1: 42 50 45 47 48 52 50

Fórmula 2: 41 48 50 46 45 42 46

Con un nivel de significancia del 0.05, ¿está usted de acuerdo con la afirmación del
fabricante?

Prueba de hipótesis para la diferencia entre dos medias para una población normal
con varianzas desconocidas pero iguales (tomando muestras pequeñas).

5. Un fabricante de automóviles decidió, recientemente, que el factor principal de las ventas


no era el automóvil, ni su servicio, sino el enfoque de ventas empleado por sus
vendedores. Para probar esta teoría, se dividió aleatoriamente un grupo de 16
vendedores en otros dos de 8 cada uno. Uno utilizó un enfoque con una publicidad
dinámica (o agresiva) hacia los clientes durante el período de un mes; el otro grupo usó
un enfoque mas tranquilo, durante el mismo tiempo. Se supone que las desviaciones de
las poblaciones son iguales.

Datos muestrales Dinámica Tranquila

Tamaño 8 8
Media ($) 106200 111900
Desviación 24400 28600

¿Proporcionan los datos evidencia suficiente que señale una diferencia en el nivel
promedio de las ventas para los dos enfoques de ventas? Use α = 0.1.

Prueba de hipótesis para la diferencia entre dos medias para una población normal
con datos apareados (tomando muestras pequeñas).

6. Sherri Welch es una ingeniero de control de calidad que trabaja en el departamento de


manufactura de limpiadores de parabrisas de la Emsco, Inc. La empresa, actualmente,
está considerando utilizar dos nuevos hules sintéticos para sus limpiadores, y Seherri es
la encargada de ver si los limpiadores fabricados con los dos tipos de hule se desgastan
de la misma manera. Equipó doce automóviles que pertenecen a empleados de la

171
Emsco con los dos nuevos limpiadores, uno de cada tipo de material. En los automóviles
1 a 6 el limpiador derecho está fabricado con el material A y el izquierdo con el material
B; en los automóviles 7 a 12, el material A fue utilizado en el limpiador izquierdo. Los
coches fueron conducidos en condiciones de operación normales hasta que los
limpiadores ya no funcionaron adecuadamente para limpiar el agua de lluvia de los
parabrisas. Los datos que damos más adelante corresponden al tiempo de vida útil (en
días) de los limpiadores. A un nivel de riesgo de 0.05, ¿se desgastan de la misma
manera los dos materiales?

Prueba de hipótesis para una proporción tomando muestras grandes.

7. La experiencia de un comerciante en aparatos y accesorios mostró que 10% de sus


clientes que compran a plazos liquidan sus cuentas antes del vencimiento de la última
mensualidad. Al sospechar un incremento de este porcentaje, el comerciante hizo un
muestreo de 200 compradores a crédito para saber sus intenciones. 33 de ellos
afirmaron tener planeado pagar sus adeudos antes de la última mensualidad. ¿Son los
datos suficientes para indicar que el porcentaje de compradores a plazos que pagaran
sus deudas antes de la última mensualidad, excede el 10%? Use α = 0.05.

Prueba de hipótesis para la diferencia entre dos proporciones tomando muestras


grandes.

8. El administrador de un hospital conjetura que el porcentaje de cuentas hospitalarias no


pagadas, aumentó durante el año anterior. Los registros del hospital muestran que las
cuentas de 48 de 1284 personas admitidas en el mes de abril no habrían sido liquidadas
después de 90 días. Este número es similar a las 34 cuentas de 1002 personas
admitidas durante el mismo mes del año anterior. ¿Con los datos, hay evidencia
suficiente que indique un incremento en el porcentaje de cuentas no liquidadas después
de más de 90 días? Use α = 0.1.

Prueba de hipótesis para la varianza de una población normal (para muestras


pequeñas).

9. Un profesor de administración ha pensado meticulosamente el diseño de sus exámenes.


Con el fin de estar razonablemente seguro de que un examen se desempeña bien al
distinguir las diferencias en el logro mostrado por los estudiantes, la desviación estándar
de los resultados del examen no puede ser demasiado pequeña. Por el otro lado, si la

172
desviación estándar es muy grande, habrá una tendencia a tener una gran cantidad de
resultados muy bajos, lo cual es deprimente para el ánimo de los estudiantes.
Experiencias pasadas han conducido al profesor a creer que una desviación de 13
puntos para un examen de 100 indica que el examen se desempeña bien al equilibrar
estos dos objetivos.
El profesor acaba de hacer un examen a su grupo compuesto por 26 estudiantes de
recién ingreso y del segundo año. La calificación promedio fue de 72.7 y la desviación de
15.9. ¿Este examen cumple con el criterio de bondad del profesor? Use α = 0.1.

Prueba de hipótesis para la varianza de poblaciones normales (tomando muestras


grandes).

10. Las especificaciones de producción de ciertos cojinetes requieren que la varianza de


2
sus diámetros no exceda 0.0040 cm . De una muestra de 35 de ellos, se obtuvo que
2
s =0.0033. Pruebe la hipótesis de que la desviación estándar de la población es de
0.004, utilizando un nivel de significancia de 0.01.

Prueba de hipótesis para el cociente de varianzas en poblaciones normales.

11. La variabilidad en la cantidad de impurezas presentes en un lote de productos


químicos, utilizada para un proceso particular, depende del tiempo que tarda el
proceso. Un fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño
ajuste al proceso 2, con esperanza de reducir la variabilidad, así como la cantidad
media de impurezas en los productos químicos. Muestras de 25 mediciones de dos
lotes cada uno produjeron las siguientes medias y varianzas:
2
x1 = 3.2 s 1 = 1.04
2
x 2 = 3.0 s 2 = 0.51

¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso
son menores para el proceso 2? Use α = 0.05.

173
EJERCICIOS PROPUESTOS

Aclaración: En todos los problemas que se presentan a continuación, se hace la suposición


de que las muestras extraídas provienen de poblaciones aproximadamente normales.

1. Aproximadamente 1 de cada 10 consumidores favorece el refresco de cola marca A.


Después de una campaña de promoción en una región de ventas dada, se seleccionó
aleatoriamente 200 bebedores de ese producto de los consumidores en el área del
mercado, y se les entrevistó para determinar la efectividad de la campaña. El resultado
de la encuesta mostró que un total de 26 personas expresó su preferencia para la bebida
marca A. ¿Proporcionan los datos evidencia suficiente para indicar un aumento en la
aceptación de la marca A en la región? (α = 0.05).

2. ¿Proporcionan los pesos de los 6 diamantes sintéticos de 0.46, 0.61, 0.52, 0.48, 0.57 y
0.54 quilates, evidencia suficiente que señale que el proceso promedio de las gemas
producidas mediante el proceso excede los 0.5 quilates? Haga la prueba con un nivel de
significancia de 0.05.

Encuentre un intervalo de confianza de 95% para el promedio del peso de los diamantes.

3. Una operación de ensamblaje en una planta manufacturera requiere de un período de


entrenamiento de aproximadamente un mes para que un nuevo operario alcance la
máxima eficiencia. Se sugirió un nuevo método de entrenamiento y se realizó una
prueba para comparar el nuevo método con el procedimiento estándar. Se entrenó a dos
grupos, de nueve obreros nuevos cada uno, durante tres semanas; un grupo utilizó el
nuevo método y el otro el procedimiento de entrenamiento estándar. Se registró el
tiempo, en minutos, que tardó cada trabajador en montar el dispositivo al final del
período de tres semanas. Estas mediciones aparecen en la tabla. Con los datos, ¿hay
evidencia suficiente que señale que el tiempo medio de montaje al final de un período de

174
entrenamiento de tres semanas es menor para el nuevo procedimiento de
entrenamiento? (Suponga que la variabilidad para las dos poblaciones de mediciones es
aproximadamente igual y que el nivel de significancia es de 0.05).

Procedimiento estándar: 32 37 35 28 41 44 35 31 34
Procedimiento nuevo: 35 31 29 25 34 40 27 32 31

Luego, encuentre un intervalo de confianza del 95 % para la diferencia del tiempo medio
de montaje entre los dos procedimientos. (Nota: Debe construir el intervalo de confianza
adecuado).

4. Un gerente de control de calidad de una compañía estaba convencido de que una


balanza para pesar materia prima, variaba según una desviación estándar de 2. A fin de
probar el equipo se pesó una carga de 107 libras, y se registraron las mediciones de
104.1, 105.2 y 110.2. ¿No corresponden estos datos a la afirmación del gerente? Use un
nivel de significancia del 10%.
Después obtenga un intervalo de confianza de 90% para la varianza de la población.

5. En un estudio para averiguar los efectos de usar modelos femeninos en la publicidad


para automóviles a un grupo de 50 hombres, al grupo A, se le mostró la fotografía de un
automóvil con una modelo y la de otro auto del mismo precio pero sin modelo. A otro
grupo, el grupo B, de 50 hombres, le fue mostrado ambos automóviles sin modelo. En el
grupo A, el automóvil que aparecía con la modelo fue considerado más lujoso por 37 de
los entrevistados; en el grupo B, el mismo auto fue juzgado como más lujoso por 23 de
los entrevistados. ¿Se considera que estos datos indican que el usar una modelo influye
en el lujo aparente de un automóvil? Use una prueba de una sola cola, con α = 0.05.

6. Un propietario de un automóvil compacto sospecha que la distancia promedio por galón


que ofrece su carro es menor que la especificada por la EPA, la cual es de 30 millas por
galón. El propietario observa la distancia recorrida por galón en 9 ocasiones, y obtiene
los siguientes datos: 28.3, 31.2, 29.4, 27.2, 30.8, 28.7, 29.2, 26.5, 28.1. Después de una
investigación, el propietario concluye que la distancia por galón es una variable aleatoria
que se distribuye normalmente, con una desviación estándar conocida de 1.4 millas por
galón. Con base en esta información, ¿Se encuentra apoyada la sospecha del
propietario con α = 0.01?

7. La desviación típica del tiempo útil de una muestra compuesta por 200 focos, es de 100
horas. El fabricante asegura que la desviación estándar del tiempo de vida de sus
productos es de 112 horas. Con un nivel de significación de 0.05, contraste la suposición
del fabricante a la hipótesis de que σ ≠ 112.

8. Una planta de producción tiene dos sistemas de fabricación muy complejos, uno de ellos
dos veces más viejo que el otro. A ambos sistemas se les da mantenimiento cada 25
días. Durante 30 días laborables se ha registrado el número de productos terminados
fabricados diariamente por cada uno de los dos sistemas, y se obtienen los siguientes
resultados:

175
Sistema nuevo: x1 = 246 s1 = 15.6
Sistema viejo: x 2 = 240 s2 = 28.2

¿Presentan estos datos evidencia suficiente para concluir que la variabilidad en la


producción diaria justifica un mantenimiento más intensivo para el sistema viejo?

9. La gerencia de aceros Reyes S.A. desea determinar si hay alguna diferencia en el


rendimiento entre el turno de día y el turno mixto. Una muestra de 100 operarios del
turno diurno revela una producción promedio de 74.3 partes por hora, con una
desviación estándar de 16 partes/h. Una muestra de 100 operarios del turno mixto revela
una producción promedio de 69.7 partes por hora, con una desviación estándar de 18
partes/h. Con un nivel de significancia de 0.10, ¿hay alguna diferencia en la producción
entre los turnos?

10. Ciertas máquinas industriales necesitan reparación cuando el desgaste de sus partes
trae como consecuencia mucha variabilidad del producto respecto de las
especificaciones. Si la variabilidad no debe exceder σ2 = 50, y una muestra de 40 dio s2
= 60, ¿está justificado el inspector al requerir el ajuste?
11. Diariamente, el servicio de aduanas de los Estados Unidos ha interceptado a lo largo
de su historia, alrededor de 28 millones en bienes de contrabando introducidos al país,
con una desviación estándar de 16 millones al día. En 64 días de 1992, elegidos
aleatoriamente, el servicio de aduanas interceptó un promedio de 30.3 millones en
bienes de contrabando. ¿Indica esta muestra (a nivel de significancia del 5%) que el
comisionado de aduanas debería preocuparse por el incremento del contrabando por
encima de su nivel histórico?

12. Un miembro de un grupo de interés público preocupado por la contaminación ambiental


afirma, en una audiencia pública, que “menos de 60% de las plantas industriales de esta
área cumple con los estándares de contaminación ambiental”. A esta reunión asistió una
funcionaria de la Agencia de Protección Ambiental (APA) que cree que el 60% de las
plantas si cumplen con los estándares; y decide probar esa hipótesis al nivel de
significancia de 0.02. La funcionaria efectúa una investigación completa de los registros
de su oficina. Muestrea 60 plantas de una población de más de 10000 plantas y
encuentra que 33 cumplen con los estándares de contaminación ambiental. ¿Es válida
la información del miembro del grupo de interés público?

13. Un documental de televisión acerca de la alimentación excesiva afirmaba que los latinos
tienen un sobrepeso aproximado de 10 lb. En promedio. Para probar esta afirmación ,
se examinó a 18 individuos elegidos aleatoriamente, y se encontró que su sobrepeso
promedio era de 12.4 lb., con una desviación estándar de 2.7 lb. A un nivel de
significancia de 0.01, ¿hay alguna razón para dudar de la validez del valor afirmado de
10 lb.?

14. La empresa Block, una compañía fabricante de chips de memoria RAM para
computadoras, está en proceso de decidir si sustituye su línea de ensamblaje
semiautomática, que tiene actualmente, por otra completamente automatizada. Como le
gustaría saber si debe actualizar su línea de ensamblado, Block ha reunido algunos
datos sobre pruebas acerca de la producción por hora de chips, esos datos se resumen
176
en la siguiente tabla. Establezca (y pruebe con un nivel de significancia de 0.02)
hipótesis apropiadas para ayudar a Block a tomar una decisión.

Estadísticos Media Desviación Tamaño


estándar
Línea 198 32 150
semiautomática
Línea automática 206 29 200

15. Donna Rose es supervisora de producción de la línea de ensamblado de unidades de


disco de computadora de la empresa Winchester Technologies. Recientemente, WT
instaló un sistema de audio para música ambiental en sus instalaciones, con la
esperanza de que la música relajara a sus obreros y condujera a una mayor
productividad. Dona se mantiene escéptica con respecto a esta hipótesis y teme que la
música sea un foco de distracción y produzca una baja en la productividad. Muestreó la
producción semanal de los mismos seis trabajadores antes de tener música ambiental y
después de haber instalado el sistema. Los datos que obtuvo se presentan a
continuación. A un nivel de significancia del 2%, ¿ha cambiado la producción promedio?

Empleado 1 2 3 4 5 6
Sin música 219 205 226 198 209 216
Con música 235 186 240 203 221 205

16. En viernes, tuvieron avance 11 acciones de una muestra aleatoria de 40 tomada de las
2500 acciones negociadas en la Bolsa de valores de Nueva York; es decir aumentó el
precio de su valor. En una muestra de 60 acciones de la Bolsa de Valores de Nueva
York, tomada el jueves, 24 acciones avanzaron. A un nivel de 0.10 de significancia,
¿puede usted llegar a la conclusión de que una porción menor de las acciones de la
bolsa de valores avanzaron el viernes con respecto al jueves?

17. La empresa Precision Analytics fabrica una amplia línea de instrumentos de precisión y
tiene una buena reputación en el campo por la calidad de sus instrumentos. Con el fin
de conservar su reputación, mantiene un estricto control de calidad en todos sus
productos. No pondrá a la venta una balanza analítica, por ejemplo, a menos que dicha
balanza muestre una variabilidad que esté significativamente por debajo de un
microgramo (con un nivel de significancia de 0.01) cuando se pesan cantidades de
aproximadamente 500 gramos. Una nueva balanza acaba de ser entregada a la división
de control de calidad por parte de la línea de producción. Se prueba la balanza
utilizándola para pesar el mismo peso estándar de 500 gramos 30 veces distintas. La
desviación estándar de la muestra resultó de 0.73 microgramos. ¿Se deberá vender la
balanza?

18. Un supervisor de control de calidad de una empresa fabricante de automóviles está


preocupado por la uniformidad del número de defectos en los automóviles que salen de
la línea de ensamblaje. Si una línea de ensamblaje tiene una variabilidad
significativamente mayor en el número de defectos, entonces es necesario introducir
cambios. El supervisor ha recogido los siguientes datos:

177
Número de defectos
Estadísticos Línea A Línea B
Media 10 11
Varianza 9 25
Tamaño de muestra 20 16

La línea de ensamblaje B tiene una variabilidad significativamente mayor en el número


de defectos? Pruebe al nivel de significancia de 0.05.

19. En un estudio diseñado para investigar si ciertos detonadores empleados con


explosivos en una mina de carbón cumplen con los requerimientos de que al menos el
90% encenderá el explosivo al ser detonado, se encontró que 174 de 200 detonadores
funcionaron adecuadamente. Pruébese la hipótesis nula contra la alternativa con un
nivel de significancia de 0.05.

20. Una compañía asegura que sus lámparas incandescentes son superiores a las de su
principal competidor. Si un estudio demostró que una muestra de 40 de esas lámparas
tienen una vida útil media de 647 horas con una desviación estándar de 27 horas,
mientras que otra muestra de 40 de su principal competidor tuvieron una vida útil media
de 638 horas de uso continuo con una desviación estándar de 31 horas. ¿Se debe
aceptar la afirmación con un nivel de significancia de 0.05?

21. El Ing. Hugo Grandy experto en Seguridad Industrial imparte, bajo el auspicio de La
Boliviana de Seguros S.A., un curso sobre principios de Seguridad e Higiene Industrial
a un grupo de subgerentes y supervisores. Las muestras aleatorias de las
puntuaciones obtenidas son:

Grupo 1: Subgerentes 121 180 122 160 141 97 212 186


Grupo 2: 128 197 180 126 167 99 147
Supervisores

Se sabe que la población de puntuaciones no se distribuye normalmente. ¿El


aprovechamiento fue igual o diferente para los dos grupos? Use un nivel de
significación de 0.05.

22. Una empresa de alumbrado eléctrico compró en forma experimental 50 ampolletas de


las marcas A y B, respectivamente. La prueba de estas ampolletas arrojó, para las de
marca A, una vida media de 1282 horas y para las de marca B, una vida media de 1208
horas. Si la desviación estándar en ambos casos se garantiza en 80 y 94 horas,
respectivamente. ¿Puede concluirse que la marca A es de superior calidad a la otra?
Use un nivel de significación de 0.02. Ambas muestras provienen de poblaciones
normales.

23. Una compañía ferroviaria instala 2 grupos de 50 durmientes cada uno. Los dos grupos
se han impregnado con creosota, pero por dos procedimientos distintos. Después de
cierto tiempo, 22 durmientes del primer grupo y 18 del segundo, están en buenas
condiciones. Comparar los dos procedimientos de impregnación. Use un nivel de
significación de 0.04. Considerar que la población se halla distribuida normalmente

178
24. Picosoft Ltd., proveedor de software de sistemas operativos para computadoras
personales, estaba planeando la oferta pública inicial de sus existencias para sacar el
suficiente capital de trabajo para financiar el desarrollo de un sistema integrado de
séptima generación, radicalmente nuevo. Con utilidades actuales de 1.61 $ por acción,
Picosoft y sus suscriptores estaban considerando un precio de oferta de 21 $,
aproximadamente 13 veces las utilidades. Para verificar lo adecuado de este precio,
eligieron aleatoriamente 7 compañías de software comercial público y encontraron que
su tasa promedio precio/utilidades era de 11.6, con una desviación estándar de muestra
de 1.3.

a) A un nivel de 0.02 de significancia, ¿puede Picosoft concluir que las existencias en


compañías de software comercial público tienen una tasa promedio precio/utilidad
significativamente diferente de 13?
b) Encuentre un intervalo de confianza del 98 % para la tasa precio/utilidad.

25. Usted es el administrador del Centro Boliviano Americano y está estudiando


implementar dos métodos nuevos para el aprendizaje del idioma inglés. Para el efecto
usted realizó una experiencia. Después de cierto período, dos grupos, cada uno
llevando uno de estos dos métodos, fueron examinados mediante un mismo test. Los
resultados obtenidos fueron:

Grupo 1: Media: 87 Varianza: 36 Tamaño de muestra: 10


Grupo 2: Media: 92 Varianza: 23 Tamaño de muestra: 16

Con base en esta información, ¿es posible afirmar que el método utilizado en el grupo
2 es más efectivo? Asuma que las varianzas de la población son aproximadamente
iguales, y utilice un nivel de significancia de 0.01.

26. En la refinería Gualberto Villarroel en la que usted está como gerente, se está
pensando modificar el proceso para producir gasolina a partir de petróleo crudo. Usted
hará la modificación sólo si la gasolina promedio obtenida por este nuevo proceso
(expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en
uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras
aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina promedio del
proceso en uso fue de 24.6 con una desviación estándar de 2.3, y para el proceso
propuesto fue de 28.2 con una desviación estándar de 2.7. Usted piensa que los
resultados proporcionados por los dos procesos son variables independientes
normalmente distribuidas con varianzas iguales. Con base en esta evidencia,
¿adoptaría usted el nuevo proceso?

27. Un fabricante de máquinas para empacar sal afirma que sus máquinas pueden llenar
con un peso dado las cajas, presentando una variabilidad no mayor a 0.01 libras
cuadradas. Una muestra de 8 cajas de 3 libras arrojó una media de 3.1 libras y una
varianza de 0.018 libras cuadradas. Utilice un nivel de significancia de 0.05.

a) ¿Hay evidencia estadística para indicar que la afirmación del fabricante está
correcta?
179
b) ¿Usted compraría las máquinas del fabricante para empacar sal si usted quiere que
la variabilidad sea no mayor a 0.005?

EJERCICIOS PARA EXAMEN

DECISIONES PARA LA EXPANSIÓN DE UNA INDUSTRIA


DE ROPA DE ALPACA

Una compañía que fabrica todo tipo de ropa de alpaca (sobre todo chompas), tanto para el
mercado nacional como para exportación, con sede en La Paz, se ha dado cuenta que
debe abrir un taller de confección en Cochabamba, si quiere cubrir con eficiencia la
demanda insatisfecha de la zona central y oriental de Bolivia. Sin embargo, antes de
realizar esta acción estratégica, debe realizar algunos estudios de mercado para asegurar
un beneficio que le permita una posición competitiva a largo plazo superior a la de la
competencia. Para ello, contrató a un analista en mercados, que deberá resolver los
aspectos que se describen a continuación.

180
• Si la posición competitiva de la empresa será mayor con respecto a la competencia, con
la nueva fábrica.
• Si los costos unitarios de producción no serán significativamente más altos a los costos
que se tienen en La Paz.
• Si el desarrollo de nuevos métodos para obtener el hilo de lana de alpaca, que han sido
desarrollados en Cochabamba, pueden reducir los costos.
• Si las ventas subirán significativamente con la nueva planta.

Para probar estadísticamente estos puntos, el analista realizó una encuesta de mercado y
una revisión de los datos históricos de la empresa. Con esta información realizó
predicciones y simulaciones para el futuro.

1. Posición competitiva.

El analista recogió la siguiente información, con respecto al número de chompas que el


mercado cochabambino estaría dispuesto a comprar de la competencia y de la compañía,
en un año:

Compañía Competenci
a
Comprarían 200 110
No 50 40
comprarían

Se quiere probar si el porcentaje de las personas que estarían dispuestos a comprar de la


compañía es significativamente mayor al de la competencia, con un nivel de significancia
del 0.05, si se supone que las muestras provienen de poblaciones que se distribuyen
normalmente.

2. Costos unitarios de producción.

El analista realizó una predicción de los costos unitarios ($us/chompa) para los siguientes
12 meses en la planta de La Paz, y con los datos muestrales del estudio en Cochabamba,
realizó una simulación de los costos unitarios si se optaba por establecer una planta en
Cochabamba (sin tomar en cuenta sobre todo los costos de transporte de la lana, desde La
Paz, para tener una base de comparación equitativa). La tabla siguiente contiene los datos:

Mes 1 2 3 4 5 6 7 8 9 10 11 12
La Paz 10. 11.1 12.3 9.8 10.5 9.6 13.0 12.4 11.6 11.4 10.7 11.2
4
Cbba 10. 12.0 12.5 9.7 11.0 9.6 12.7 12.4 10.0 11.5 9.9 11.9
8

Se quiere probar, con un nivel de riesgo de 0.1, si los costos unitarios de Cochabamba
difieren significativamente de los costos unitarios en la planta de La Paz, realizando una
prueba paramétrica.

3. Métodos para la obtención del hilo de lana.


181
En Cochabamba la compañía cuenta con un laboratorio a escala piloto, para desarrollar
nuevos métodos (más rápidos) para la obtención del hilo de lana de alpaca. Una reciente
investigación reveló la siguiente información, dada en minutos por madeja producida:

Operario 1 Operario 2 Operario 3


Método 1 5.7 6.1 5.5
Método 2 7.8 7.9 7.5
Método 3 6.5 6.2 6.4

El analista sabe por experiencia, que las clasificaciones no están relacionadas entre sí, que
las muestras provienen de poblaciones normales que tienen una misma varianza
poblacional. Con un nivel de significación del 0.05, se quiere probar:

a) ¿Existe algún método que sea más rápido que los otros para la producción del hilo de
lana?
b) ¿Existe influencia de los operarios en la rapidez de la producción?

Nota: Para resolver este problema, el lector deberá primero aprender a cómo realizar
el procedimiento de la ANOVA, que se detalla en el siguiente capítulo.

4. Ventas estimadas.

El analista realizó una simulación para los pedidos de ventas al por mayor de varios
comerciantes, si se abriera la planta en Cochabamba, en miles de $us/año:

Ventas (miles de Número de


$us) pedidos
10 – 13 3
13’ – 17 5
17’ – 24 7
24’ – 30 2

a) Se quiere determinar si las ventas según pedidos, sigue una distribución normal, que
tiene un nivel de ventas promedio de 20000 $us, con una desviación estándar de 5000
$us. Use un nivel de 0.05 de riesgo.
b) Si las ventas se ajustan a este patrón normal, con los datos muestrales de la tabla
anterior, probar con el mismo nivel de riesgo, si la media de ventas puede ser menor a
17000 $us.
5. Decisión final.

El analista debe decidir si dar un informe positivo o no, para que la empresa se anime a
establecer una planta en Cochabamba, y está basada en la combinación de los 4 aspectos
antes mencionados.

a) ¿La compañía tendrá una posición competitiva significativamente superior a la de la


competencia?

182
b) ¿Los costos unitarios de la planta en Cochabamba serán significativamente iguales a los
costos unitarios de la planta en la Paz?
c) ¿La investigación realizada para hallar un método más rápido para la producción de hilo
de lana, que reduzca los costos, fue provechosa?
d) ¿Las ventas anuales por pedidos al por mayor siguen una distribución normal con media
de 20000 y desviación de 5000 $us?

El analista ha decidido que si 3 de las 4 preguntas son afirmativas, elevará un informe


positivo para que la compañía establezca una planta en Cochabamba. ¿Qué dirá en su
informe?

183
CAPÍTULO 6

ANÁLISIS DE VARIANZA

1. INTRODUCCIÓN

El análisis de varianza (ANOVA) permite probar la significancia de las diferencias entre más
de dos medias de muestra o hacer inferencias sobre si las muestras fueron tomadas de
poblaciones que tienen la misma media.

El análisis de varianza será útil en situaciones como la comparación del kilometraje logrado
por 5 tipos de gasolina; en la prueba de cuál de 4 métodos de entrenamiento produce el
más rápido aprendizaje, etc.

Sin embargo estas aplicaciones no son todo lo que se puede querer conocer. Con respecto
a si hay diferencias en la eficiencia entre 5 tipos de gasolina, hay varias preguntas que
quedan sin resolver: ¿Qué autos se usaron para las pruebas? ¿Los instrumentos para
medir la eficiencia eran similares en precisión? En la prueba de la eficiencia de los métodos
de aprendizaje se podría preguntar: ¿Qué tipo de profesores se usaron? ¿La calidad de los
textos es la misma? ¿Los estudiantes tenían un mismo nivel de inteligencia? El resolver
estas preguntas lleva al vasto tema del diseño de experimentos, del cual, el ANOVA es el
fundamento.

2. SUPOSICIONES

Para utilizar el ANOVA se deben realizar las siguientes suposiciones:

• Cada una de las muestras es tomada de una población normal de forma independiente y
además cada una de las poblaciones tiene la misma varianza (Si los tamaños de las
muestras son lo suficientemente grandes no se necesita la suposición de normalidad,
pero esto no ocurre frecuentemente).

• Si se prueba que las muestras salieron de la misma población, entonces se pueden


reunirlas en una sola muestra.

En el capítulo 7 (pruebas no paramétricas) se tiene una prueba alternativa a la ANOVA (de


un factor) en el cual no se tienen que hacer estas suposiciones, y es la prueba H de
Kruskal-Wallis.

3. PROCEDIMIENTO

El análisis de varianza está basado en una comparación de dos estimaciones diferentes de


la varianza de la población total, mediante una prueba de hipótesis:

180
H 0 : µ1 = µ 2 = K = µ n
H1 : µ1 ≠ µ 2 ≠ K ≠ µ n
Para probar esta hipótesis se realizan los siguientes pasos:

1. Se determina una estimación de la varianza de la población a partir de la varianza entre


las medias de las muestras (intervarianza).
2. Se determina una segunda estimación de la varianza de la población desde la varianza
dentro de las muestras (intravarianza).
3. Se compara estas dos estimaciones. Si su valor es aproximadamente igual, aceptamos
que las muestras provienen de la misma población.

int er var ianza


Para probar la hipótesis nula, se utiliza el valor crítico: Fα ,ν1 ,ν2 = y se
int ra var ianza
compara con el valor del estadístico F con un cierto nivel de significancia. Si la Hipótesis
nula fuera falsa, la intervarianza debería ser significativamente mayor que la intravarianza.

4. ANÁLISIS DE VARIANZA CON UN FACTOR

Se supondrá que se tiene “k” diferentes niveles de un factor que se desean comparar
(llamados tratamientos). La respuesta observada para cada nivel de los “k” tratamientos es
una variable aleatoria.

Observación
1 2 3 .... n
1 y11 y12 y13 .... y1n
2 y21 y22 y23 .... y2n
Tratamiento 3 y31 y32 y33 .... y3n
: : : : : :
k yk1 yk2 yk3 .... ykn

El modelo estadístico para representar cada observación de la tabla está dado por:

yij = µ + τi + ε ij

donde: i = 1, 2, ..., k tratamientos


j = 1, 2, ..., n niveles

µ = Parámetro común a todos los tratamientos, llamada media global.

τi = Parámetro asociado al i-ésimo tratamiento, llamado el efecto del tratamiento “i”.

εij = Error aleatorio del proceso de muestreo.

Primer paso.
181
Se desea probar la igualdad de los efectos de los “k” tratamientos:

H 0 = τ1 = τ 2 = ... = τk = 0
H1 = τi ≠ 0 para al menos una "i"

Si H0 es cierta, entonces yij = µ + εij . Esto es, la variable de respuesta no se ve


afectada por el factor investigado.

Segundo paso.

El investigador fija su nivel de riesgo:


α = α0
Tercer paso.

Aquí se muestra la tabla de cálculos para este tipo de análisis de varianza.

Fuente de Suma de Grados de Media cuadrada Razón F


variación cuadrados libertad
Entre SSTr k-1 SSTr MSTr
tratamientos MSTr = F=
k −1 MSE
Error SSE N-k SSE
muestral MSE =
N−k
Total SST N-1

El estadístico de prueba es la F de Fisher, puesto que se están relacionando dos varianzas.


Las ecuaciones para hallar este valor son:
k
T2 n
SST = ∑∑ y − 2
ij
i =1 j=1 N
Ti2 T 2
k 2 n
SSTr = ∑ − donde:
 k n
T =  ∑∑ y ij 
2 
Ti = ∑ yij
i =1 n i N  i =1 j=1  j=1

SSE = SST − SSTr


Cuarto paso.

1−α
α
182
Fα ,k −1, N −k F
Quinto paso.

Se realiza la decisión con base en la regla establecida.

Ejemplo.

El gerente de una sucursal de una cadena de tiendas renunció. Tres vendedores pueden
ocupar su puesto, que tienen la misma antigüedad, educación, etc. Para tomar una
decisión, se sugirió examinar los registros de ventas mensuales de cada uno. En la tabla se
muestran los resultados muestrales de las ventas en miles de dólares:

Sra Mapes Sr. Sonnar Sr. Mafee


15 15 19
10 10 12
9 12 16
5 11 16
16 12 17
Media: 11 Media: 12 Media: 16

¿Existen diferencias significativas para basar la contratación en las ventas? Realice la


prueba con un nivel de 0.05.

Resolución.

Paso 1:

H0: No hay diferencia significativa entre las ventas medias de los tres vendedores

H1: Al menos una media de ventas es diferente

Paso 2:
α = 0.05

Paso 3:
MSTr
F=
MSE

Paso 4:
ν1 = k − 1 = 3 − 1 = 2

α = 0.05
ν 2 = N − k = 15 − 3 = 12
183
F
F0.05,2,12 = 3.89
Paso 5:

Se obtienen algunos valores de las muestras:

X1 X12 X2 X22 X3 X32


15 225 15 225 19 361
10 100 10 100 12 144
9 81 12 144 16 256
5 25 11 121 16 256
16 256 12 144 17 289
T1=55 687 T2= 60 734 T3=80 1306

2
 3 5 
T =  ∑∑ y ij  = ( 55 + 60 + 80 ) = 38025
2 2

 i =1 j=1 
3 5
T2 38025
SST = ∑∑ yij2 − = (687 + 734 + 1306) − = 2727 − 2535 = 192
i =1 j=1 N 15

5 5 5
T1 = ∑ yij = 55 T2 = ∑ yij = 60 T3 = ∑ yij = 80
j=1 j=1 j=1

Ti2 T 2 552 + 602 + 802 38025


3
SSTr = ∑ − = − = 2605 − 2535 = 70
i =1 n i N 5 15

SSE = SST − SSTr = 192 − 70 = 122

Se llena la tabla con los valores calculados:

Fuente de Suma de Grados Media cuadrada Razón F


variación cuadrados de
libertad
Entre SSTr=70 k-1=2 SSTr 70 MSTr 35
tratamientos MSTr = = = 35 F= = = 3.44
k −1 2 MSE 10.17

184
Error SSE=122 N-k=12 SSE 122
muestral MSE = = = 10.17
N − k 12

Total SST=192 N-1=14

Comparando el estadístico F con el valor crítico, aceptamos la hipótesis nula.

Conclusión: No existe diferencia significativa entre las medias de los vendedores.

Acción: La empresa deberá seleccionar al nuevo gerente tomando en cuenta otro aspecto
que no sean las ventas.

5. ANÁLISIS DE VARIANZA DE DOS FACTORES SIN INTERACCIÓN

Aquí se supondrá que el experimentador tiene a su disposición mediciones de “a”


tratamientos distribuidos sobre “b” bloques. Se supone que hay exactamente una
observación de cada tratamiento en cada bloque.

Bloques
B1 B2 B3 .... Bb Medias
1 y11 y12 y13 .... y1b
2 y21 y22 y23 .... y2b
Tratamientos 3 y31 y32 y33 .... y3b
: : : : : :
a ya1 ya2 ya3 .... yab
Medias

El modelo para el análisis de esta clase de experimento es:

y ij = µ + α i + β j + εij
donde: i = 1, 2, ..., a tratamientos
j = 1, 2, ..., b bloques

µ = Parámetro común a todos los tratamientos, llamada media global.


αi = Parámetro asociado al i-ésimo tratamiento, llamado el efecto del tratamiento “i”.
βj = Efecto del j-ésimo bloque
εij = Error aleatorio del proceso de muestreo.

Primer paso.

Se desea probar la igualdad de los efectos de los “a” tratamientos:

185
H 0 = α1 = α 2 = ... = α k = 0
H1 = α i ≠ 0 para al menos una "i"

También probar la igualdad de los efectos de los “b” bloques:

H 0 : β1 = β2 = K = βk = 0
H1 : β j ≠ 0 para al menos una " j"
Si H0 es cierta para los dos factores, entonces y ij = µ + ε ij . Esto es, la variable de
respuesta no se ve afectada por los factores investigados.

Segundo paso.

α = α0

Tercer paso.

Se muestra la tabla de cálculos para este tipo de análisis de varianza.

Fuente de Suma de Grados de Media cuadrada Razón F


variación cuadrados libertad
Tratamientos SSTr a-1 SSTr MSTr
MSTr = FTr =
a −1 MSE
Bloques SSBl b-1 SSBl MSBl
MSBl = FBl =
b −1 MSE
Error muestral SSE (a-1)(b-1) SSE
MSE =
(a − 1)(b − 1)
Total SST ab-1

Donde existe un estadístico para las dos pruebas: Tratamientos y Bloques. Las ecuaciones
necesarias son:

2
a b
T2  a b 
SST = ∑∑ y − 2
ij donde: T =2
 ∑ ∑ y ij 
i =1 j=1 ab  i =1 j =1 
Ti2 T 2
a
SSTr = ∑
b
− donde: Ti = ∑ yij
i =1 b ab j=1

186
a
b Tj2T2
SSBl = ∑ − donde: Tj = ∑ yij
j=1 a ab i =1

SSE = SST − SSTr − SSBl

Cuarto paso.

Existen dos reglas de decisión para las dos pruebas:

Para Tratamientos: Para Bloques:

1−α 1−α
α α

Fα ,a −1,( a−1)(b−1) F Fα ,b−1,( a −1)(b−1) F

Quinto paso.

Se realiza la decisión tanto de bloques como de tratamientos.

Ejemplo.

Se diseñó un experimento para estudiar el rendimiento de 4 detergentes diferentes. Las


siguientes lecturas de “blancura” se obtuvieron con un equipo especialmente diseñado para
12 cargas de lavado distribuidas aleatoriamente en tres modelos de lavadoras.

Bloques
Lavadora 1 Lavadora 2 Lavadora 3
A 45 43 51
Detergentes B 47 46 52
C 48 50 55
D 42 37 49

Use un nivel de significancia del 0.01. ¿El rendimiento de los detergentes es igual? ¿Las
diferencias en los resultados obtenidos por las lavadoras son significativas?

Resolución.

Paso 1:

187
Para los tratamientos:

H0: El rendimiento de los detergentes es igual

H1: El rendimiento de los detergentes no es igual

Para los bloques:

H0: Los resultados obtenidos en las lavadoras es el mismo

H1: Los resultados obtenidos en las lavadoras son diferentes

Paso 2:
α = 0.01

Paso 3:

Para tratamientos: Para Bloques:

MSTr MSBl
FTr = FBl =
MSE MSE

Paso 4:

Para tratamientos: Para bloques:

α = 0.05 α = 0.05

F0.01,3,6 = 9.78 F F0.01,2,6 = 10.92 F

ν1 = a − 1 = 4 − 1 = 3 ν1 = b − 1 = 3 − 1 = 2
ν 2 = (a − 1)(b − 1) = (4 − 1)(3 − 1) = 6 ν 2 = (a − 1)(b − 1) = (4 − 1)(3 − 1) = 6

Paso 5:

Bloques
Lavadora 1 Lavadora 2 Lavadora 3 Totales (Ti)
A 45 (2025) 43 (1849) 51 (2601) 139
Detergentes B 47 (2209) 46 (2116) 52 (2704) 145
C 48 (2304) 50 (2500) 55 (3025) 153
D 42 (1764) 37 (1369) 49 (2401) 128
188
Totales (Tj) 182 (8302) 176 (7834) 207 (10731) 565 (26867)

Los valores entre paréntesis corresponden al cuadrado de su valor.

Los cálculos para determinar los estadísticos de prueba son:

319225
T 2 = ( 565 ) = 319225 SST = 26867 − = 264.92
2

4(3)
1392 + 1452 + 1532 + 1282 319225
SSTr = − = 110.92
3 12
1822 + 1762 + 207 2 319225
SSBl = − = 135.17
4 12
SSE = 18.83
Traduciendo los valores calculados a la tabla:

Fuente Suma de Grados de Media cuadrada Razón F


de cuadrados libertad
variación
Trat. SSTr=110.92 a-1=3 SSTr 110.92 MSTr 36.97
MSTr = = = 36.97 FTr = = = 11.78
a −1 3 MSE 3.14
Bloq. SSBl=135.17 b-1=2 SS 135.17 MSBl 67.585
MSBl = Bl = = 67.585 FBl = = = 21.52
b −1 2 MSE 3.14
Error SSE=18.83 (a-1)(b-1)=6 SSE 18.83
muestral MSE = = = 3.14
(a − 1)(b − 1) 6

Total SST=264.92 ab-1=11

Se rechazan ambas hipótesis nulas.

Conclusión: El rendimiento de los detergentes es diferente y los resultados obtenidos por


las lavadoras son significativamente diferentes.

Acción: Como la blancura depende del tipo de detergente y del tipo de lavadora que se usa
para obtenerla, el consumidor deberá elegir tomando en cuenta estos dos aspectos.

189
EJERCICIOS DE CLASE

1. Probar la hipótesis nula de que tres métodos de instrucción, que miden el nivel específico
de habilidades para el manejo de cierta máquina, son equivalentes. Las notas obtenidas
en 15 operarios seleccionados aleatoriamente en 3 grupos se presentan a continuación.

Método A 86 79 81 70 84
Método B 90 76 88 82 89
Método C 82 68 73 71 81

Tomar 5% como nivel de significancia.

2. La siguiente tabla da el número de millas por galón recorridas por un grupo de autos
usando distintos tipos de gasolina. Estos datos muestrales provienen e una población
que se distribuye normalmente y se sabe que las calificaciones son independientes. Use
un nivel de significancia de 0.05. Determinar si hay diferencia significativa entre las
gasolinas usadas y entre los tipos de autos.

Gasolinas/autos 1 2 3 4
A 12 15 14 11
B 14 12 15 15
C 11 12 10 14
D 15 18 16 17

190
EJERCICIOS PROPUESTOS

1. En un estudio se compararon los efectos de cuatro promociones mensuales sobre las


ventas. A continuación presentamos las ventas unitarias de 5 tiendas que utilizaron las 4
promociones en meses diferentes:

Muestra gratis 78 87 81 89 85
Regalo de un paquete 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso por correo 79 83 78 69 81

¿Las promociones producen diferentes efectos sobre las ventas? (Use un nivel de
significancia de 0.01).

2. La oficina de contabilidad del gobierno de Bolivia está interesada en ver si las oficinas de
tamaño parecido gastan la misma cantidad de dinero en personal y equipo (Las oficinas
que gastan más son susceptibles de una auditoria especial) Se examinaron los gastos
mensuales de tres oficinas: una de ellas en el ministerio de agricultura, otra en el
ministerio de estado y la última en el ministerio del interior. Los datos se presentan a
continuación. Al nivel de significancia de 0.01, ¿existen diferencias en los gastos delas
diferentes oficinas?

Gastos mensuales (en cientos de dólares)


durante algunos meses
Agricultura 10 8 11 9 12
Estado 15 9 8 10 13 13
Interior 8 16 12

3. Náutica, ofrece 4 marcas populares de pantalones Jeans: Levis, Wrangler, American


Colt, Oops. La tienda desea ver si existen diferencias en el número de pantalones
vendidos de marca diferente. El gerente ha contado el número de pantalones vendidos
de cada marca en diferentes meses. Al nivel de significancia de 0.05, ¿son iguales las
ventas de las 4 marcas?

Pantalones vendidos
Levis 17 21 13 27 12
Wrangler 27 13 29 9
191
American Colt 13 15 17 23 10 21
Oops 18 25 15 27 12

4. Cuatro formas diferentes, y a pesar de ello supuestamente equivalentes, de un material


estandarizado de una prueba de aptitud vocacional fue aplicado a 5 estudiantes, los
cuales obtuvieron las siguientes calificaciones:

Estudiante 1 Estudiante 2 Estudiante 3 Estudiante 4 Estudiante 5


Forma A 75 73 59 69 84
Forma B 83 72 56 70 92
Forma C 86 61 53 72 88
Forma D 73 67 62 79 95

¿Es razonable manejar las 4 formas como equivalentes? ¿Es razonable pensar que los
estudiantes tienen el mismo nivel de aptitud vocacional? Pruebe con un nivel de
significancia del 0.01.

5. Una compañía de investigación ha diseñado tres sistemas distintos para limpiar


manchas de aceite. La siguiente tabla contiene los resultados de cada sistema ,
medidos en qué tanta superficie (en metros cuadrados) es limpiada en una hora. Los
datos se obtuvieron probando cada método en varias sesiones. ¿Son los tres sistemas
igualmente efectivos? Utilice un nivel de significancia de 0.05.

A 55 60 63 56 59 55
B 57 53 64 49 62
C 66 52 61 57

a) Si la población de donde se extrajeron las muestras es normal.


b) Si no se sabe nada acerca de la forma d ela población de donde se extrajeron las
muestras.

6. Una empresa de publicidad de amplia cobertura, desea saber si el tamaño de un


anuncio y el color del mismo dan como resultado una diferencia en la respuesta de los
lectores de revistas. Una muestra aleatoria de lectores ven anuncios de cuatro colores
diferentes y de tres tamaños distintos. A cada lector se le pide que califique la
combinación específica de tamaño y color del 1 al 10.En la siguiente tabla se muestran
las puntuaciones para cada combinación.

Tamaño del Color del anuncio


anuncio Rojo Azul Naranja Verde
Pequeño 2 3 3 8
Mediano 3 5 6 7
192
Grande 6 7 8 8

¿Existe diferencia en la eficacia de un anuncio por color y por tamaño? Use un nivel de
significancia de 0.05. Antes de resolver esta pregunta, probar si el color del anuncio es
independiente del tamaño, para la calificación.

EJERCICIOS PARA EXAMEN

PROBLEMAS DIVERSOS DE DECISIÓN

Estas aplicaciones se encuentran en los capítulos 5 y 7, en la parte de “Ejercicios para


Examen”.

1. Se ha realizado un experimento para determinar si cuatro temperaturas específicas de


horneado afectan la densidad de un cierto tipo de ladrillo. El experimento proporcionó los
siguientes datos:

Temperatura Densidad
Observaciones
1 2 3 4 5
100 21.8 21.9 21.7 21.6 21.7
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6 21.5
175 21.9 21.7 21.8 21.4

¿Afecta la temperatura de horneado la densidad del ladrillo? Use α = 0.01 .

2. Una fábrica de textiles cuenta con un gran número de telares. Se supone que cada uno
tiene la misma producción de tela por minuto. Para investigar esta suposición, cinco
telares son escogidos al azar, y se mide la cantidad de tela producida en 5 tiempos
diferentes. Se obtienen los datos siguientes:

Número Producción (lb/min)


de telar
1 2 3 4 5
1 14.0 14.1 14.2 14.0 14.1
2 13.9 13.8 13.9 14.0 14.0
3 14.1 14.2 14.1 14.0 13.9
4 13.6 13.8 14.0 13.9 13.7
5 13.8 13.6 13.9 13.8 14.0

Realice la ANOVA para un nivel de 0.05.


193
3. Los siguientes datos se refieren al número de unidades defectuosas producidas por
cuatro trabajadores operando, en sucesión, tres diferentes máquinas.

Máquinas Trabajadores
1 2 3 4
1 37 38 38 32
2 31 40 43 31
3 36 33 41 38

Realice un análisis de varianza y determine si las máquinas producen diferente número


de unidades defectuosas y si los trabajadores influyen en el número de defectos
producidos, con un nivel del 0.05 de significancia.

194
CAPÍTULO 7

MÉTODOS NO PARAMÉTRICOS

1. INTRODUCCIÓN

Hasta el momento se ha visto cómo extraer muestras de poblaciones y tratar de llegar a


conclusiones a partir de esas muestras. Pero, ¿cómo se pueden resolver los casos cuando
no se conoce la forma de la distribución de la población? La respuesta es, aplicando la
estadística no paramétrica.

La mayor parte de las pruebas de hipótesis hacen inferencias sobre parámetros de la


población. Estas pruebas paramétricas utilizan estadísticos paramétricos muestrales que
provienen de la población sometida a prueba. Pero para formular esas pruebas, se hicieron
suposiciones restrictivas sobre la población, diciendo que la población era normal, pero no
siempre es así.

Es por esta razón que los estadísticos han desarrollado técnicas útiles que no hacen
suposiciones restrictivas sobre la forma de la distribución de la población, llamadas pruebas
no paramétricas o sin distribución.

2. PRUEBAS NO PARAMÉTRICAS

Existen varias pruebas, pero las más importantes son:

• Pruebas de bondad de ajuste.


• Pruebas de independencia de atributos.
• Prueba del signo de los datos pareados.
• Prueba U de Mann-Whitney.
• Prueba H de Kruskal-Wallis.

3. VENTAJAS Y DESVENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS.

Las ventajas de estas pruebas sobre las paramétricas son:

1. No exigen hacer la suposición de que una población está distribuida normalmente o tiene
forma específica.

2. En general, son más fáciles de llevar a cabo y de entender. No requieren cálculos tan
laboriosos.

3. Algunas veces ni siquiera se requiere la ordenación formal o por rangos.

195
La desventajas son:

1. Ignoran cierta cantidad de información.

2. A menudo no son tan eficientes o exactas como las pruebas paramétricas.

4. PRUEBAS CHI-CUADRADA.

Hay dos pruebas de hipótesis que se apoyan en el estadístico chi-cuadrada:

• Prueba de bondad de ajuste


• Prueba de independencia de atributos.
2
El hecho de que se use una variable χ , es porque es una buena aproximación a la
distribución de la variable aleatoria que se utiliza como estadístico de prueba en ambas, no
porque estén relacionadas con varianzas.

4.1. Prueba de independencia de atributos

En muchas ocasiones, los n elementos de una muestra pueden clasificarse de acuerdo a


dos diferentes criterios. En este caso el interés se centra en conocer si los dos métodos de
clasificación son estadísticamente independientes.

Se supondrá que el primer método de clasificación tiene “r niveles” y el segundo “c” niveles.
Datos de mercado mediante encuestas o históricos permiten obtener una tabla de
contingencia de r x c, que contiene las frecuencias observadas f ij.

1 2 ... c
1 f11 f12 ... f1c
2 f21 f22 ... f2c
: : : ... :
r fr1 fr2 ... frc

Restricción: Si hay un número pequeño de frecuencia esperada en la tabla, la chi-cuadrada


puede llevar a conclusiones erróneas. En general se dice que la chi-cuadrada no debe
aplicarse si más del 20% de las frecuencias esperadas en la tabla son menores a 5. Si esto
ocurre, para salvar la prueba, se deberá proceder a unir filas o columnas para cumplir con la
restricción.

Primer paso.
H0: Las dos clasificaciones son independientes

H1: Las dos clasificaciones son dependientes

Segundo paso.
α = α0

196
Tercer paso.

Para validar esta prueba se usa el siguiente estadístico de prueba:

(f − Eij )
2
r c
χ 2 = ∑∑
ij

i =1 j =1 Eij

que sigue una distribución chi-cuadrada con (r-1)(c-1) grados de libertad.

donde: fij es la frecuencia observada de la tabla de contingencia.


c es el número de columnas de la tabla.
r es el número de filas de la tabla.
Eij es la frecuencia esperada que corresponde a cada frecuencia observada de la
tabla, y se halla mediante:

1 c r
Eij = ∑ ij ∑ fij
f
n j =1 i =1

Cuarto paso.

Esta siempre es una prueba de cola derecha o superior:

1−α
α

χ α2 ,ν χ2
Quinto paso.

Se rechazará la hipótesis de independencia de clasificaciones si:

χ 2 ≥ χ 2α ,ν

Ejemplo.

La compañía de alfombras “Volaré” en la que usted es el gerente de ventas se interesó en


comparar en tres áreas de una ciudad la fracción de constructores de casas que prefieren
alfombras sobre otras cubiertas para pisos. El objetivo fue decidir cómo distribuir los
esfuerzos de venta sobre las áreas. Para ello se realizó una encuesta, con los siguientes
resultados.

197
Áreas
Cubierta para piso 1 2 3
Alfombra 69 126 16
Otros materiales 78 99 27

¿Indican los datos una diferencia entre un área de la ciudad y otra en el porcentaje de los
que prefieren alfombras? Use un nivel de significancia de 0.05.

Resolución.

Paso 1:
H0: No hay diferencia entre el área de la ciudad y la preferencia de cubiertas

H1: Existe diferencia entre el área de la ciudad y la preferencia de cubiertas

Paso 2:
α = 0.05

Paso 3:

(f − Eij )
2
r c
1 c r
χ = ∑∑ ∑ ij ∑ fij
ij
2
Eij = f
i =1 j =1 Eij n j =1 i =1

Paso 4:

ν = (2 − 1)(3 − 1) = 2

α = 0.05
2
2
χ 0.05,2 = 5.99 χ

Paso 5:

Primero se calculan las frecuencias esperadas (columna 2) con la ecuación:

1 c r
(Total de fila )(Total de columna)
Eij = ∑ f ij ∑ f ij =
n j =1 i =1 Total g eneral

(f − Eij )
2
ij
y luego se realiza la operación (columna 3)
Eij

198
Áreas Total
Cubierta para piso 1 2 3
Alfombra 69 (74.74) (0.44) 126 (114.4) (1.18) 16 (21.86) (1.58) 211
Otros materiales 78(72.26) (0.46) 99 (110.6) (1.22) 27 (21.14) (1.62) 204
Total 147 225 43 415

Sumando todos los valores de la columna 3, se determina el valor del estadístico:

(f − Eij )
2
2 3
χ = ∑∑
ij
2
= 6.48
i =1 j =1 Eij

Se observa que el valor del estadístico se encuentra en la región de rechazo, por lo tanto se
procede a rechazar la hipótesis nula.

Conclusión: Existe diferencia entre el área de la ciudad y la preferencia de cubiertas para


pisos.

Acción: Los mayores esfuerzos de ventas estarán centrados en las áreas 2 y 1 y no así en
el área 3.

4.2. Prueba de bondad de ajuste

Este es otro tipo de pruebas de hipótesis. Aquí, no interesa conocer el valor de algún
parámetro de cierta distribución de probabilidad, sino mas bien, conocer qué distribución
sigue cierta variable aleatoria, o determinar cuán bien se ajusta un conjunto de datos
observados a un conjunto esperado.

Este conjunto de datos u observaciones debe ser primero ordenado en un histograma de


frecuencias con k intervalos de clase constantes o no.

Intervalos de Frecuencias
clase observadas (Oi)
1 O1
2 O2
: :
k Ok

Restricción: Existen dos reglas:

• Si sólo hay dos categorías o intervalos de clase en la tabla de frecuencias, las


frecuencia esperadas deben tener el valor de 5 o mayor.

199
• Para más de dos categorías, la chi-cuadrada no debe aplicarse si más del 20% de las
frecuencias esperadas son menores a 5. Si se diera este caso, para aplicar la prueba se
debe unir dos categorías a fin de cumplir con la restricción.

Primer paso.

Se puede decir, que la prueba es del estilo:

H0: f(x) = f0 (x)

H1: f(x) ≠ f0 (x)

Donde la función de distribución a la cual se ajustan los datos observados o experimentales


puede ser tanto discreta (binomial, hipergeométrica, poisson, multinomial, binomial
negativa, etc) como continua (normal, t de Student, uniforme, etc).

Segundo paso.
α = α0

Tercer paso.

El estadístico adecuado es:

( Oi − ei )
2
k
χ =∑
2

i =1 ei

donde: Oi es la frecuencia observada en el intervalo de clase i


ei es la frecuencia esperada en el intervalo de clase i

Se tiene que χ2 sigue una distribución aproximadamente chi-cuadrada con (k-p-1) grados de
libertad, donde:

k, es el número de intervalos de clase


p, es el número de parámetros estimados mediante estadísticos muestrales.

Paso 4:

1−α
α

χ α2 ,ν χ2

200
Paso 5:

El último paso es determinar si el estadístico de prueba se encuentra en la región de


aceptación o de rechazo, y tomar la decisión adecuada.

Ejemplo.

Un inspector de la Alcaldía de una ciudad, inspeccionó un casino para ver si los dados con
los que se jugaba la ruleta estaban cargados o no. Para ello fue al lugar, pidió un cubilete,
eligió un dado y lo lanzó 180 veces, obteniendo los siguientes resultados.

x Oi
1 28
2 36
3 36
4 30
5 27
6 23

El inspector quiere determinar si existe evidencia estadística suficiente para decidir elevar
una multa al casino por fraude. Pruebe al nivel 0.05.

Resolución.

Paso 1:

Lo que se esperaría si el dado no estuviera cargado es que la probabilidad de que salga


1
cualquier valor entre 1 y 6, sea la misma, es decir de . El proceso se ajustaría a una
6
distribución uniforme con esa probabilidad. Por lo tanto las hipótesis planteadas son:

1
H0: f ( x ) = x = 1, 2, 3, 4,5, 6 (El dado no está cargado)
6
1
H1: f ( x ) ≠ x = 1, 2,3, 4,5, 6 (El dado está cargado)
6

Paso 2:
α = 0.05

Paso 3:
( Oi − ei )
2
k
χ =∑
2

i =1 ei

Paso 4:
201

α = 0.05
2
χ 0.05,5 = 11.07 χ2
ν = 6 −1 = 5

Paso 5:
x Oi Pe ei
( Oi − ei )
2

ei
1 28 1/6 30 0.13
2 36 1/6 30 1.20
3 36 1/6 30 1.20
4 30 1/6 30 0
5 27 1/6 30 0.30
6 23 1/6 30 1.63
Total 180 1 180 4.47

( Oi − ei )
2
6
χ =∑
2
= 4.47
i =1 ei

Se acepta la hipótesis nula.

Conclusión: Los resultados del lanzamiento del dado siguen una distribución uniforme con
probabilidad de 1/6.

Acción: El inspector comprobó que el dado no está cargado, y por lo tanto no tomará
ninguna acción para multar al casino.

5. PRUEBA DEL SIGNO PARA DATOS PAREADOS

Su nombre proviene del hecho de que se basa en la dirección (o signos de mas y menos)
de un par de observaciones y no en su magnitud numérica; es decir en el signo de una
diferencia: positivo para una diferencia positiva, y negativo para una diferencia negativa.

Esta prueba generalmente se aplica a experimentos de antes y después o experimentos


sobre la preferencia hacia un producto.

Existen dos pruebas: una para muestras pequeñas, que se basa en una distribución
binomial y otra para muestras grandes, que se basa en la aproximación de la normal a la
binomial.

Primer paso.

La hipótesis nula corresponderá a una probabilidad de 0.5; es decir que no habrá


preferencia o cambios en ninguno de los elementos que están siendo comparados.

202
H0: p = 0.5

H1: p ≠ 0.5; p > 0.5; p < 0.5

Segundo paso.
α = α0
Tercer y cuarto pasos.

Para muestras pequeñas (n<20), se utiliza como estadístico de prueba de hipótesis una
distribución binomial con p = 0.5, pudiendo ser el suceso “éxito”, ya sea el número de
signos positivos o los negativos que resultaron en el experimento. De acuerdo a la hipótesis
alternativa planteada, se puede tener una prueba de dos colas o una cola inferior o
superior.

1−α 1−α 1−α

α α α α
2 2

x1 x2 x2 x1
x x x
R A R A R R A

Los valores críticos se determinan en base a la tabla para la distribución binomial


acumulada, dada en el anexo.

Para muestras grandes (n>20), el estadístico de prueba a usar es la distribución normal


(aproximación a la binomial), con las siguientes características:

(x ± 0.5) − µ
µ = 0.5n σ = 0.5 n z=
σ

donde: x, es el número de signos positivos o negativos.


0.5, es el factor de corrección de continuidad.

Si el número de signos + o - es mayor que n/2 se usa el estadístico con el signo -.


Si el número de signos + o - es menor que n/2 se usa el estadístico con el signo +.

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2

Quinto paso.

203
Basándose en la información muestral, se asignan signos positivos o negativos,
dependiendo si los valores han disminuido en la característica éxito o de interés o han
aumentado. En base al número de estos signos, se determina el valor del estadístico
muestral y se toma la decisión de rechazar o aceptar la hipótesis nula.

Ejemplo.

Los siguientes datos son las horas-hombre que semanalmente se pierden en promedio por
accidentes en 11 plantas industriales antes y después de que se implantara un programa
de seguridad industrial.

Antes 45 73 46 124 33 57 83 34 26 17 34
Despué 36 60 44 119 35 51 77 34 24 11 29
s

Pruebe si el programa de seguridad fue eficaz con un nivel de significancia de 0.05.

Resolución.

Paso 1:
H0: p = 0.5 (El programa no fue eficaz)

H1: p > 0.5 (El programa fue eficaz)

Paso 2:

α = 0.05

Paso 3:

Como el tamaño muestral es menor a 20, se elige la distribución binomial.

Paso 4:

Se elige la distribución binomial con n = 10 (no se toma en cuenta el dato pareado 34-34,
puesto que no tiene signo positivo ni negativo, sino 0), con una p = 0.5, siendo una prueba
de cola superior:

x P(x) P acumulada
0 0.00100
1 0.00897
2 0.04400
3 0.11720
204
4 0.20510
5 0.24600
6 0.20510
7 0.11720
8 0.04400 0.05470
9 0.00897 0.01070
10 0.00100 0.00100

Se acumulan los valores de las probabilidades hasta llegar a un valor cercano a 0.05. Esto
ocurre cuando x = 8, que es el valor crítico que separa la región de aceptación o rechazo.

La gráfica correspondiente es:

α = 0.05

x
0 1 2 3 4 5 6 7 8 9 10
x2=8
A R

Paso 5:

Se asignarán signos positivos, cuando se han reducido las horas-hombre perdidas


mediante el programa de seguridad industrial.

Se asignarán signos negativos, cuando no se han reducido las horas-hombre perdidas


mediante el programa de seguridad industrial.

Se asignarán valores de 0, cuando las horas-hombre perdidas por accidentes son las
mismas antes y después del programa.

Antes 45 73 46 124 33 57 83 34 26 17 34
Despué 36 60 44 119 35 51 77 34 24 11 29
s
Signos + + + + - + + 0 + + +

Como el número de signos positivos es de 9 y el valor crítico es de 8, se rechaza la


hipótesis nula.

Conclusión: El programa de seguridad fue eficaz, porque redujo significativamente las


horas-hombre perdidas por accidentes.

Ejemplo.

Una empresa afirma que la vida media de un grupo de baterías que fabrica es superior a
250 horas. Un defensor de los consumidores desea saber si tal afirmación está justificada, y
205
para ello mide las vidas medias de 24 baterías. Determinar si la empresa tiene razón con un
nivel de 5% de significancia.

271 230 198 275 282 225 284 219


253 216 262 288 236 291 253 224
264 295 211 252 294 243 272 268

Resolución.

Paso 1:

H0: p = 0.5 ( µ = 250 ) (La afirmación de la empresa no es correcta)

H1: p > 0.5 ( µ > 250 ) (La afirmación de la empresa es correcta)


Paso 2:
α = 0.05

Paso 3:

Como la muestra es mayor a 20, entonces se usa el estadístico Z (Aproximación de la


normal a la binomial).
(x ± 0.5) − µ
µ = 0.5n σ = 0.5 n z=
σ
Paso 4:

α = 0.05

z0.05 = 1.645 z

Paso 5:

Se asignará signo positivo, cuando la vida media de la batería sea superior a 250.
Se asignará signo negativo, cuando la vida media de la batería sea inferior a 250.

271 (+) 230 (-) 198 (-) 275 (+) 282 (+) 225 (-) 284 (+) 219 (-)
253 (+) 216 (-) 262 (+) 288 (+) 236 (-) 291 (+) 253 (+) 224 (-)
264 (+) 295 (+) 211 (-) 252 (+) 294 (+) 243 (-) 272 (+) 268 (+)

El tamaño muestral es de 24 baterías. El número de signos positivos es de 15:

n
= 12
2

206
Como el número de signos positivos es mayor a 12, se usará el signo negativo para el
factor de corrección por continuidad.

(15 − 0.5) − 12
µ = 0.5(24) = 12 σ = 0.5 24 = 2.45 z= = 1.02
2.45
Se acepta la hipótesis nula.

Conclusión: La afirmación de la empresa de que la vida media de sus baterías es mayor a


250 horas es falsa.

Acción: El defensor de los consumidores puede elevar su queja a la oficina de protección al


consumidor, para que ésta realice las gestiones necesarias para que la compañía revise
sus procesos.

6. PRUEBAS DE SUMA DE RANGOS

Existen dos pruebas no parámetricas que se basan en la suma de rangos que son la
Prueba U de Mann-Whitney y la prueba H de Kruskal-Wallis. Ambas sirven para probar si
dos o más muestras independientes provienen de la misma población o no.

6.1. Prueba U de Mann-Whitney

Es especialmente útil cuando se seleccionan dos conjuntos aleatorios independientes de


observaciones muestrales (que deben ser por lo menos de nivel ordinal) y se quiere saber si
provienen o no de la misma población. Esta es una prueba alternativa a la paramétrica de
diferencia de medias para muestras independientes.

Primer paso.

H0: Las dos muestras provienen de la misma población

H1: Las dos muestras no provienen de la misma población

Segundo paso.
α = α0

Tercer paso.

Existen dos estadísticos de prueba, dependiendo de si se toman muestras pequeñas o


grandes.

Se considera muestra pequeña, si la mayor de las dos muestras tiene 20 o menos


observaciones. Como estadístico para la prueba de hipótesis se usan las siguientes
ecuaciones:

207
n1 (n1 + 1) n2 (n2 + 1)
U = n1n2 + − ∑ R1 U ' = n1n2 + − ∑ R2
2 2

Donde: n1, es el tamaño de la muestra 1.


n2, es el tamaño de la muestra 2.
∑R1, es la suma de los rangos para la muestra 1.
∑R2, es la suma de los rangos para la muestra 2.

El menor valor calculado, sea U o U’ sirve para llegar a la decisión de rechazar o aceptar la
hipótesis nula, que corresponderá a que las muestran vienen de la misma población.

Conforme aumentan los tamaños de las dos muestras independientes, la distribución del
estadístico U tiende hacia la distribución normal (n>20). El estadístico usado es entonces:

 n + n + 1
∑R −∑R
1 2 −  (n1 − n2 ) 1 2 
 2 
z=
 n + n + 1
n1n2  1 2 
 3 

Cuarto paso.

Si las muestras son pequeñas se usan los valores críticos de la tabla U, dada en el anexo.
Para determinar el valor crítico (llamaremos Uα ), los datos necesarios son: el tamaño de las
dos muestras (Generalmente se designa como muestra 1 a la que tiene mayor tamaño de
entre las dos), el nivel de significancia y el conocimiento de si la prueba es de dos o una
cola.

La hipótesis nula se rechazará si el valor calculado de U es menor o igual al valor crítico


(Esta regla es la contraria al procedimiento generalmente seguido en la toma de decisión de
la mayoría de las otras pruebas).
Rechazo Aceptación

0 Uα
Si las muestras son grandes, los valores críticos se hallan mediante la distribución normal
estándar.

α 1−α α 1−α 1−α


2 2
α α

− zα zα z zα z − zα z
2 2

Quinto paso.

208
Los valores muestrales se clasifican de mayor a menor. Al valor mayor se le da el rango de
1, al segundo mayor valor (sin importar de qué muestra sea) se le da el rango de 2, y así
sucesivamente. Luego se suma los rangos de la muestra 1 y 2 y se procede a calcular el
estadístico de prueba. Por último se toma la decisión en base a la regla planteada en el
paso 4.

Ejemplo.

Los siguientes son los números de minutos que una muestra de 15 hombres y 12 mujeres
tomó para realizar una breve prueba de selección aplicada a los solicitantes de trabajo de
un banco grande.

H 8.8 7.8 6.6 10.7 8.9 8.4 6.9 6.4 6.3 8.0 8.6 8.1 9.1 9.7 9.9
M 7.5 8.7 8.3 6.2 6.5 7.7 9.8 9.6 9.2 10.4 8.2 8.5
Se quiere probar si los hombres tardaron más en realizar la prueba que las mujeres a un
nivel de 0.05 de significancia.

Resolución.

Paso 1:
H0: El tiempo en realizar la prueba es igual en hombres y mujeres
H1: Los hombres tardaron más en realizar la prueba que las mujeres

Paso 2:
α = 0.05

Paso 3:
n1 (n1 + 1) n2 (n2 + 1)
U = n1n2 + − ∑ R1 U ' = n1n2 + − ∑ R2
2 2

Paso 4:

Rechazo Aceptación

0 U 0.05 = 55

Paso 5:

Se obtiene la suma de rangos para las dos muestras. En este caso el rango 1
corresponderá al menor tiempo, ya que interesa esa característica:

n1 8.8 7. 6.6 10. 8.9 8. 6.9 6.4 6.3 8.0 8.6 8.1 9. 9.7 9.9
8 7 4 1
R1 18 9 5 27 19 14 6 3 2 10 16 11 20 23 25 208
n2 7.5 8. 8.3 6.2 6.5 7. 9.8 9.6 9.2 10. 8.2 8.5
7 7 4
209
R2 7 17 13 1 4 8 24 22 21 26 12 15 170

Se obtienen los estadísticos:

15(15 + 1) 12(12 + 1)
U = 15(12) + − 208 = 92 U ' = 15(12) + − 170 = 88
2 2

Se elige el menor valor, es decir U’.

Como el valor de U’ es mayor al valor crítico, entonces se acepta la hipótesis nula.

Conclusión: Los hombres y las mujeres tardaron la misma cantidad de tiempo en la prueba
de selección.

Ejemplo.

Los siguientes son los aumentos de peso (en libras) de pavos jóvenes, que son alimentados
por dos dietas distintas pero por lo demás, las condiciones en que se les cría son idénticas.

Dieta 16.3 10.1 10.7 13.5 14.9 11.8 14.3 10.2 12.3 14.4
1
12.0 14.7 23.6 15.1 14.5 18.4 13.2 14.0 10.3 11.6
Dieta 21.3 23.8 15.4 19.6 12.0 13.9 18.8 19.2 16.7 18.1
2
15.3 20.1 14.8 18.9 20.7 21.1 15.8 16.2 16.5 20.1

Use el nivel de significancia de 0.01 para probar que en promedio la segunda dieta genera
mayor aumento de peso que la primera.

Como las muestras son independientes, se usa la prueba U:

Paso 1:
H0: La dieta 1 y la 2 generan el mismo aumento de peso en los pavos ( µ 2 = µ1 )

H1: La segunda dieta genera mayor aumento de peso que la primera ( µ 2 > µ1 )

Segundo paso.
α = 0.01

Tercer paso.

Como el tamaño de muestra es de 20, entonces se usará la aproximación a la normal:

210
 n + n + 1
∑R −∑R
1 2−  (n1 − n2 ) 1 2 
 2 
z=
 n + n + 1
n1n2  1 2 
 3 
Cuarto paso.

α = 0.01

z 0.01 = 2.33 z
Quinto paso.

Como se está comparando la dieta 2 con la 1, se determinan los rangos de las muestras,
asignando el valor de 1al mayor valor, es decir al pavo con mayor aumento de peso.

Dieta 23.6 18.4 16.3 15.1 14.9 14.7 14.5 14.4 14.3 14.0
1
2 12 16 20 22 24 25 26 27 28
Dieta 13.5 13.2 12.3 12.0 11.8 11.6 10.7 10.3 10.2 10.1
1
30 31 32 33.5 35 36 37 38 39 40
Dieta 23.8 21.3 21.1 20.7 20.1 20.1 19.6 19.2 18.9 18.8
2
1 3 4 5 6.5 6.5 8 9 10 11
Dieta 18.1 16.7 16.5 16.2 15.8 15.4 15.3 14.8 13.9 12.0
2
13 14 15 17 18 19 21 23 29 33.5

Se calcula el valor del estadístico:

553.5 − 266.5
z= = 3.88
 20 + 20 + 1 
20(20)  
 3
Se rechaza la hipótesis nula.

Conclusión: En promedio, los pavos con la dieta 2 aumentaron más de peso que los pavos
con la dieta 1.

Acción: Alimentar a todos los pavos con la dieta 2.

6.2. Prueba H de Kruskal Wallis

Es especialmente útil cuando se seleccionan k conjuntos aleatorios independientes de


observaciones muestrales (que deben ser por lo menos de nivel ordinal) y se quiere saber si
provienen o no de la misma población (o si tienen medias iguales). Esta es una prueba
211
alternativa a la ANOVA, la cual no requiere que las poblaciones estén normalmente
distribuidas y que sus desviaciones estándares sean iguales.

Primer paso.

H0: Las muestras provienen de la misma población


H1: Las muestras provienen de poblaciones distintas

Segundo paso.
α = α0
Tercer paso.

12  k ∑ R i 
2

H= ∑  − 3(N + 1)
N(N + 1)  i =1 n i 
donde:

∑R i , es la suma de los rangos de la muestra i


ni es el tamaño de la muestra i.
N es el número combinado de observaciones para todas las muestras.
k-1 son los grados de libertad.
k es el número de poblaciones.

Cuarto paso.

La distribución del estadístico H se acerca mucho a la distribución chi-cuadrada con k-1


grados de libertad con la condición de que cada tamaño de muestra sea por lo menos de 5.

1−α
α

χ α2 ,ν χ2
Quinto paso.

Se hallan la sumas de rangos de todas las muestras, ordenando los valores de menor a
mayor y asignando el valor de 1 para el valor más bajo.

Luego se halla el valor del estadístico y se realiza la decisión.

Ejemplo.

212
Se va a llevar a cabo un seminario de administración para un gran número de ejecutivos de
manufactura, finanzas y comercio. Antes de programar las sesiones, el director quiere saber
si los tres grupos tienen conocimientos semejantes sobre los principios de administración o
gerenciales. Se tomó muestras de los ejecutivos de los tres grupos y se aplicó una prueba a
cada uno.

Manufactura Finanzas Comercio


51 14 89
32 31 20
17 68 60
69 87 72
86 20 56
62 28 22
96 77
97

Si no existe diferencia entre las tres distribuciones, el director impartirá una sola sesión a
todos, pero si hay diferencia en las puntuaciones, se impartirán sesiones separadas.

El director del seminario no sabe nada acerca de la forma de la distribución de la población


de las puntuaciones sobre principios de administración y tampoco puede suponer que las
varianzas de las poblaciones son iguales. ¿Impartirá sesiones separadas? Realice la
prueba al nivel 0.05.

Resolución.

H0: Las distribuciones de las puntuaciones sobre principios de administración son iguales

H1: No todas las distribuciones son iguales

Segundo paso.
α = 0.05

Tercer paso.

12  k ∑ R i 
2

H= ∑  − 3(N + 1)
N(N + 1)  i =1 n i 

Cuarto paso.

α = 0.05
2
2
χ 0.05,2 = 5.99 χ

213
Quinto paso.

Se hallan la sumas de rangos de todas las muestras, ordenando los valores de menor a
mayor y asignando el valor de 1 para el valor más bajo.

Manufactura R1 Finanzas R2 Comercio R3


51 9 14 1 89 19
32 8 31 7 20 3.5
17 2 68 13 60 11
69 14 87 18 72 15
86 17 20 3.5 56 10
62 12 28 6 22 5
96 20 77 16
97 21
Sumas 82 85.5 63.5
Se halla el valor del estadístico H:

12  822 85.52 63.52 


H=  + +  − 3(21 + 1) = 0.14
21(21 + 1)  7 8 6 

Comparando este valor con el crítico, se acepta la hipótesis nula.

Conclusión: No hay evidencia estadística suficiente para que el director pueda pensar que
los niveles de conocimiento sobre administración de los tres grupos que tomarán el
seminario sea diferente.

Acción: El director planificará una sola sesión para todos los asistentes al seminario.
7. ÁRBOL DE DECISIÓN PARA ELEGIR LA PRUEBA PARAMÉTRICA O NO
PARAMÉTRICA EN LA RESOLUCIÓN DE PROBLEMAS

Se plantea aquí una guía para realizar la decisión de usar una prueba paramétrica o no
paramétrica en la resolución de problemas inferenciales.

214
215
ÁRBOL DE DECISIÓN PARA ELEGIR LA PRUEBA PARAMÉTRICA O NO, ADECUADA
EN LA RESOLUCIÓN DE PROBLEMAS
¿Clasificaciones 2
r c
independientes? Independencia de 2 (f ij − Eij )
atributos (NP) χ = ∑∑
Cualquiera i =1 j =1 Eij
¿Bloques y ANOVA
tratamientos iguales? (Dos factores) (P)
2
12  k ∑ R i 
Prueba H (NP) H=  ∑  − 3(N + 1)
Si N(N + 1)  i =1 n i 
¿Las medias son
iguales? n1 ( n1 + 1)
ANOVA U = n1n2 + − ∑ R1
Mayor a dos (Un factor) (P) 2
(Muestras n ( n + 1)
independientes) n<20 U ' = n1n2 + 2 2 − ∑ R2
2
Prueba U (NP)
¿Las medias son  n + n + 1
Dif. Medias (P) ∑R −∑R 1 2
− (n1 − n2 ) 1 2 
No iguales? n>20  2 
(Muestras z=
independientes)  n + n + 1 
n1n2  1 2 
¿Cuadro Dos  3 
bidimensional? Prueba de signos (NP)
¿Experimentos n<20 Distribución binomial
antes y después? Dif. Medias (P)
(p=0.5)
(Muestras dependientes o
apareadas)
Una ¿Preferencia de (x ± 0.5) − 0.5n
n>20 z=
productos?
Prueba de signos (NP) 0.5 n
¿Número de
muestras?
2
k
¿Ajustar a una 2 ( Oi − ei )
distribución? Bondad de ajuste (NP) χ =∑
i =1 ei

216
EJERCICIOS DE CLASE

Prueba de independencia de atributos.

1. Hay tres marcas dominantes de un cierto producto. Es necesario determinar si las


porciones del mercado difieren significativamente entre 4 comunidades. Se analiza un
conjunto de 240 ventas y se encuentra que están colocadas entre las comunidades y
marcas como aparece en la tabla.

Comunidades
Marcas A B C D
I 10 14 18 25
II 15 18 23 16
III 28 29 21 23

¿Hay alguna diferencia significativa en la preferencia de las marcas por las 4


comunidades? Realice la prueba con α = 0.05.

Prueba de bondad de ajuste.

2. En años recientes, 55% de los automóviles fabricados y vendidos en Estados Unidos


fueron producidos por General Motors, 25% por Ford, 15% por Chrysler y 5% por los
demás fabricantes (Honda, etc). Una muestra registrada de las ventas de los automóviles
construidos en Estados Unidos, la última semana, reveló que 174 fueron
manufacturados por Chrysler, 275 por Ford, 330 por General Motors y 21 por todos los
demás. Pruebe al nivel 0.05 la hipótesis de que no ha habido cambio en el patrón de
ventas.

3. Supongamos que la fábrica Quimbol exige que los universitarios del último año que
buscan trabajo en ella sean entrevistados por 3 ejecutivos. Cada ejecutivo da al
candidato una evaluación positiva o negativa. La tabla contiene los resultados de la
entrevista de los 100 últimos candidatos.

Evaluaciones positivas Número de candidatos que


posibles en 3 entrevistas reciben estas evaluaciones
0 18
1 47
2 24
3 11

Para planear la fuerza de trabajo, el director de reclutamiento piensa que el proceso de


entrevista puede aproximarse mediante una distribución binomial con p=0.4, es decir,
con una probabilidad de 40% de que cada candidato reciba una evaluación positiva en
cualquiera de las entrevistas. Si el director quiere probar esta hipótesis en un nivel 0.05
de significancia. ¿Qué ha de hacer?

217
Prueba del signo para datos pareados.

Muestras pequeñas.

4. La dirección de la compañía Samuelson Chemicals recomendó realizar un programa de


entrenamiento en computación en la planta para los gerentes, a fin de mejorar su
conocimiento sobre el uso de computadoras en contabilidad, mantenimiento, producción,
etc. Algunos gerentes opinaron que el programa sería valioso; otros dijeron, que no
tendría ningun valor. A pesar de las objeciones la compañía realizó el programa.

Se eligió al azar una muestra de 15 gerentes. El nivel de capacidad lo determinó un


grupo de expertos antes de iniciado el programa, como sobresaliente, excelente, buena,
aceptable y deficiente. Después del programa, que duró 3 meses, se hizo la misma
evaluación. El signo + indica mejoría, y el signo - declinación. Se tiene interés en
determinar si dicho programa fue efectivo. ¿Tales gerentes son más aptos después del
programa que antes?

Nombre Antes Despúes Signo


J.G. B S +
A.P. A E +
M.G. E B -
M.F. D B +
S.C. E E 0
E.A. B S +
G.G. D A +
J.M. E S +
M.C. B D -
J.R. D B +
L.G. B S +
J.R. A E +
M.F. B A -
L.R. B S +
L.C. D B +

Use α = 0.1.

Muestras grandes.

5. Una empresa de refrescos embotellados ha encomendado al departamento de


investigación de mercado poner a prueba un nuevo producto. Se consideran dos
versiones, una bebida más bien dulce y otra algo amarga. Se va a hacer una prueba
formada por una muestra de 64 consumidores. Cada uno catará la bebida dulce (A) y la
amarga (B) indicando su preferencia. Los resultados de la prueba indicaron que 46 de
los 64 consumidores prefirieron la bebida dulce ¿Como se efectuará la prueba de
hipótesis y qué bebida se lanzará al mercado? α = 0.05.

218
Prueba U de Mann-Whitney.

Muestras pequeñas.

6. Existe interés en determinar si hay diferencia en la aptitud mecánica entre los


trabajadores de sexo masculino o femenino en la línea industrial de ensamble. Para
resolver el asunto, se seleccionaron al azar 9 hombres y 5 mujeres y se sometió a cada
persona a una prueba de aptitud mecánica.

Puntuación
Hombres 1500 1600 670 800 1100 800 1320 1150 600
Mujeres 1400 1200 780 1350 890

¿Existe alguna diferencia significativa en las aptitudes mecánicas de mujeres y varones?


Usar un nivel de significancia del 0.05

Muestras grandes.

7. Supongase que 25 mujeres y 15 hombres se someten a una prueba de aptitud


mecánica. Las calificaciones de tal aptitud se clasificaron en los siguientes rangos:

Rangos para las mujeres:

7 33 39 16 19 20 1 2 37 29 27 9 5
23 31 28 13 36 15 18 4 21 8 11 35

Rangos para los hombres:

26 6 38 10 14 24 30 17 40 3 22 25 32
34 12

¿Existe alguna diferencia significativa en las aptitudes mecánicas de mujeres y varones?


Usar un nivel de significancia del 0.05.

Prueba H de Kruskal Wallis.

8. El gerente regional de un banco está interesado en el índice de cambios o movimiento


de las cuentas personales de cheques en cuatro de sus sucursales. Se pregunta si hay o
no diferencia en los índices de movimiento entre las cuatro sucursales (El índice de
movimiento es la rapidez con la que el dinero de una cuenta se deposita y retira. Una
cuenta extremadamente activa puede tener un índice de 300; pero si sólo se giran uno o
dos cheques, el índice puede ser de aproximadamente 30). Los índices de movimiento
de las muestras seleccionadas de las cuatro sucursales son:

219
Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4
208 91 302 99
307 62 103 116
199 86 319 189
142 91 340 103
91 80 180 100
296 131

Usando el nivel 0.01, determine si hay diferencia en los índices de movimiento de las
cuentas personales de cheques entre las cuatro sucursales.

220
EJERCICIOS PROPUESTOS

1. En la siguiente tabla se muestran las respuestas de los consumidores respecto a una


forma de hacer publicidad de productos para tres mercados:

Mercado de productos

Opinión 1 2 3 Total

A favor 124 111 137 372


No a favor 55 44 38 137
Sin opinión 21 45 25 91

Total 200 200 200 600

Halle las frecuencias esperadas para cada frecuencia observada de la tabla.


¿Ofrecen los datos evidencia suficiente para indicar que las proporciones de las
respuestas en las categorías “a favor”, “no a favor” y “sin opinión”, difieren entre los tres
mercados de productos? (α = 0.005).

2. A fin de planear la cantidad de efectivo que debe conservar en la bóveda, un banco


quiere saber si el depósito de un cliente tiene una distribución normal. Deseoso de recibir
un aumento, un empleado recién contratado reunió la siguiente información:

Depósito (En Bs.) hasta 900 900 - 2100 2100 y más


Frecuencia observada 20 65 25

a) Calcule las frecuencias esperadas si los datos tienen distribución normal con una
media de 1500 Bs. y una desviación estándar de 600 Bs.
b) Calcule el estadístico chi-cuadrada.
c) Formule la hipótesis nula y alternativa. Pruebe sus hipótesis en el nivel 0.05 y formule
una conclusión explícita.

3. Los datos de la tabla adjunta se refieren al número de ausencias del trabajo de 318
trabajadores de cierta empresa, en dos períodos semestrales consecutivos. El
ausentismo se considera “bajo” (B), en caso de tres ausencias o menos, “medio” (M)
2
entre 3 y 5 inclusive, y “alto” (A), para más de 5. Utilice la prueba de χ para mostrar que
la “propensión al ausentismo” no existe, lo que implica que las dos variables de
clasificación son independientes. (Use (α = 0.05).

Primer Semestre
B M A
221
Segundo B 165 35 4
Semestre M 40 24 20
A 2 13 15

4. Un fabricante de motores de automóviles ha probado 150 motores para determinar la


tasa promedio de consumo de gasolina (km/lt). Se piensa que el consumo tiene una
distribución normal. Usando la media muestral y la desviación estándar muestral como
parámetros para la distribución normal, el fabricante construyó la siguiente tabla. ¿Los
datos de esta tabla confirman la conclusión de que el consumo de gasolina sigue una
distribución normal, a un nivel de significación de 0.05?

Km/lt 10 o menos 11-12 13-14 15-16 17-18 19 y más


No de motores en cada grupo 8 27 43 42 26 4
No. de motores en una 14 26 41 36 22 11
distribución normal

5. Una firma de cosméticos está interesada en las preferencias de consumo de sus clientes
respecto del diseño de sus productos. Recientemente, presentó 4 diseños a una muestra
aleatoria de 200 paseantes en un Centro Comercial. Los resultados se muestran a
2
continuación. Use χ para probar la significación estadística de esta información (Utilice
α = 0.05).

DISEÑO A B C D

PREFERENCIA 43 31 69 57

6. Un restaurante anunció que en la noche del jueves en menú consistiría en platillos


inusitados para gourmets, como calamar, liebre, caracoles, salmón ahumado y ensalada
especial. Como parte de una encuesta más amplia, se preguntó a una muestra de 81
clientes regulares si preferían el menú normal o el menú para gourmets. Utilizando la
prueba del signo y el nivel 0.02, pruebe si a los clientes les agradó más el menú anterior
que el normal. Justifique su conclusión.

7. Se enseña un procedimiento de ensamble a un grupo de personas empleando la


secuencia de pasos ya conocida. Se enseña a otro grupo usando una técnica
experimental. Los tiempos (en segundos) necesarios para ensamblar la unidad para las
dos muestras fueron:

Grupo que usa los pasos conocidos: 41, 36, 42, 39, 36, 48.
Grupo que usa la técnica experimental: 21, 27, 36, 20, 19, 21, 39, 24, 22.

Con la prueba U de Mann-Whitney y el nivel 0.05 de riesgo, pruebe la afirmación de que


el grupo experimental necesitó de menos tiempo para ensamblar la unidad. Como es
usual, enuncie las hipótesis nula y alternativa, y la regla de decisión, calcule U y U’ y
adopte una decisión.

222
8. Se compararán las tasas de homicidios en ciudades grandes, pequeñas y áreas rurales.
Se seleccionan muestras de las tres áreas. Las tasas están dadas por millar de
habitantes.

Ciudades Ciudades Áreas


grandes pequeñas rurales
6.7 7.8 12.6
5.2 7.1 8.4
11.2 12.2 8.2
8.6 9.6 4.9
5.5 5.2 11.7
6.8 7.1

Suponiendo que las tasas no se distribuyen en forma normal, utilice el nivel 0.01 para
determinar si existe alguna diferencia entre las distribuciones de las tasas de homicidios
para los tres grupos.

9. Los siguientes datos muestran los índices de trabajo defectuoso de los empleados antes
y después de un cambio en el plan de incentivos de sueldos. Compare los siguientes
dos conjuntos de datos para ver si el cambio disminuyó las unidades defectuosas
producidas. Utilice el nivel de significancia de 0.10.

Antes 8 7 6 9 7 10 8 6 5 8 10 8
Despué 6 5 8 6 9 8 10 7 5 6 9 5
s

a) Usando una prueba paramétrica.


b) Usando una prueba no paramétrica.

10. Un fabricante de juguetes cambió el tipo de máquinas inyectoras de plástico que usaba
porque una máquina moderna dio evidencias de ser más económica. Sin embargo, al
iniciar la temporada de navidad, la producción pareció un tanto menor a la del año
anterior. Puesto que los registros de producción de los últimos años estaban
disponibles, el gerente de producción decidió comparar el resultado mensual de los 15
meses en los que se usaron las antiguas máquinas y los 11 meses de producción de
este año. Los registros muestran estas cantidades de producción, en unidades, con las
máquinas anteriores y modernas.

Antigua Moderna Antigua Moderna


992 965 966 956
945 1054 889 900
938 912 972 938
1027 850 940
892 796 873
983 911 1016
223
1014 877 897
1258 902

¿Puede concluir la compañía, a un nivel de significancia de 0.1, que el cambio en las


máquinas ha reducido la producción?

a) Prueba paramétrica.
b) Prueba no paramétrica.

11. Una compañía de regalos que atiende sus pedidos por correo tiene los siguientes datos
de muestra de ventas en dólares, separados de acuerdo con la forma de pago del
pedido. Pruebe la hipótesis de que no existe diferencia en la cantidad de dólares
recibidos por pagos en efectivo, cheque o tarjeta de crédito. Use un nivel de
significancia de 0.05.

T. crédito 78 64 75 45 82 69 60
Cheque 110 70 53 51 61 68
Efectivo 90 68 70 54 74 65 59

a) Prueba paramétrica.
b) Prueba no paramétrica.

12. Al nivel de significancia de 0.05, ¿podemos concluir que los siguientes datos provienen
de una distribución de Poisson con media de 3?

N° llegadas por día 0 1 2 3 4 5 6 o más


N° de días 6 18 30 24 11 2 9

13. Kevin Morgan, gerente nacional de ventas de una compañía de electrónica, ha


recabado la siguiente estadística de salarios de los ingresos de la fuerza de ventas en
su campo. Tiene las frecuencias observadas, en la tabla siguiente. Al nivel de
significancia de 0.1, ¿puede concluir Kevin que la distribución de los ingresos de la
fuerza de ventas (en miles de $) es normal?

25-30 30’-36 36’-42 42’-48 48’-54 54’-60 60’-66


9 22 25 30 21 12 6

14. Un editor de periódicos, que trata de determinar con precisión las características de
mercado de su periódico, se pregunta si la costumbre de la gente de la ciudad de leer
diarios está relacionada con el nivel educativo de los lectores. Se aplica una encuesta a
los adultos del área referente a su nivel educativo y a la frecuencia con que leen el
periódico. Los resultados se muestran en la siguiente tabla:

Nivel educativo
Frecuencia con Profesional o Pasante de Preparatoria No terminó la
que la lee posgrado licenciatura preparatoria
Nunca 10 17 11 21
Algunas veces 12 23 8 5
224
Mañana o tarde 35 38 16 7
Ambas ediciones 28 19 6 13

A un nivel de significancia de 0.1, ¿la frecuencia con que se lee el periódico en la


comunidad difiere de acuerdo con el nivel de educación de los lectores?
15. Los siguientes son los números de infracciones por conducir a alta velocidad expedidas
por dos oficiales de policía durante 20 días.

Oficial 1 6 11 12 10 15 7 9 7 14 11
Oficial 2 9 13 12 17 13 11 13 12 15 13
Oficial 1 14 6 9 12 8 16 10 12 15 12
Oficial 2 10 12 9 14 13 11 15 14 15 18

A un nivel de significancia de 0.01, se quiere probar si en promedio, los dos oficiales


expidieron una cantidad igual de infracciones por conducir a alta velocidad.

a) Prueba paramétrica.
b) Prueba no paramétrica.

16. Se desea determinar, al nivel de significación de 0.01, si la aceptación de los chocolates


Breick tiene alguna diferencia entre los hombres y las mujeres. Una muestra
representativa arrojó los siguientes resultados:

Les gusta si no
Hombres 45 15
mujeres 25 5

a) Use prueba paramétrica.


b) Use prueba no paramétrica.

17. El número de saltos ornamentales que realiza un competidor olímpico son 4 en cada
competencia, la probabilidad de que cada salto se anule el de 30% a juicio de un
experto. Si en la última competencia se registraron los siguientes resultados, pruebe a
un nivel de significancia de 0.05 si la distribución de saltos anulados sigue una
distribución binomial.

Número de saltos Frecuencia


anulados
0 21
1 35
2 19
3 5

18. Después de recabar datos sobre la contaminación del aire en Cochabamba durante un
año, el Dr. H. Rosas recomendó a la alcaldía realizar medidas estrictas para controlar la
emisión de gases tóxicos a la atmósfera. Con los datos que se presentan a
continuación, ¿se tiene evidencia de que las medidas disminuyeron la contaminación
ambiental?. Use 2% de nivel de significación.
225
año anterior actual
Ene 7 5.3
Feb 6 6
Mar 5.4 5.6
Abr 5.9 5.7
May 3.9 3.7
Jun 5.7 4.7
Jul 6.9 6.1
Ago 7.6 7.2
Sep 6.3 6.4
Oct 5.8 5.7
Nov 5.1 4.9
Dic 5.9 5.8

a) Prueba paramétrica.
b) Prueba no paramétrica.

226
EJERCICIOS PARA EXAMEN

DECISIONES PARA AMPLIAR LA COMPETITIVIDAD DE UNA


EMPRESA LÍDER EN INVESTIGACIÓN Y DESARROLLO

A un equipo de profesionales investigadores de las áreas de economía, marketing,


administración, finanzas y producción, le fueron asignados varios asuntos concernientes al
mercado de un producto que una empresa producía y comercializaba, desde hace varios
años. A la empresa le interesa sobre todo ampliar su imagen de marca, realizar mejoras en
el diseño del producto, plantear estrategias de negocios más lucrativas, minimizar errores
en la producción y por sobre todo reducir sus costos, para obtener un margen de utilidad
más amplio. Esta corporación cree que sólo trabajando en equipo podrá lograr este
objetivo.

Primera reunión.

El grupo se reunió para realizar mejoras en el producto. Anteriormente consistía de una


licuadora con 10 velocidades, vaso con capacidad para 5 litros y un botón de toque de alta
velocidad, independiente de las anteriores. Esta licuadora se vendía a un precio de 70 $us.
Después de la reunión y tomando en cuenta algunas sugerencias de los clientes, los
expertos llegaron al siguiente acuerdo:

1. Introducir, tanto en el botón de toque como en las velocidades, un mecanismo de


seguridad para que los niños no tengan accidentes.
2. Introducir en el interior del vaso, justo en el medio, que coincida con la tapa pequeña
(que existe en la tapa superior), un tubo colador. Esto permitirá que los clientes puedan
utilizar la licuadora también como una sumidora.
3. El vaso sea de un material irrompible, igualmente fácil de lavar y que no permita que los
olores se impregnen, como lo logra un vaso de vidrio.

Luego de la reunión, se realizó una encuesta para ver la aceptación de estos cambios en el
mercado. La compañía cree que la nueva licuadora podrá venderse en 85 $us. Los

227
resultados de la encuesta a un grupo de 12 clientes, a los cuales se les preguntó en cuanto
comprarían una licuadora con las 3 características, son:

70 85 90 60 120 70 75 100 95 85 90 80

El gerente de la empresa quiere saber si hay evidencia estadística suficiente para concluir
que con las mejoras en el diseño se podrá vender la nueva licuadora en 85 $us., con un
nivel de significación del 0.05.

a) Si no se sabe nada acerca de la forma de la población.


b) Si se supone que la población sigue una distribución normal.

Si no se puede vender la licuadora a ese precio, no se implementaran las mejoras.


¿Conviene a la empresa implementar las mejoras en el diseño de la licuadora?

Segunda reunión.

Independientemente si a la empresa le conviene implementar las mejoras en el diseño,


existe un problema en el área de producción que se debe resolver. Se cree que el
porcentaje de licuadoras defectuosas que produce la línea de ensamble 1 es
significativamente superior a la de la línea 2. Para probar esto se realizó un muestreo
aleatorio, cuyos resultados se dan en la siguiente tabla:

Línea 1 Línea 2
Defectuosa 7 3
No defectuosa 18 22

Probar la conjetura anterior, con un nivel del 0.05 de significancia, si:

a) Las muestras provienen de poblaciones aproximadamente normales.


b) No se sabe nada acerca de las formas de las poblaciones de las cuales se extrajeron las
muestras.

Si se logra probar la hipótesis anterior, entonces la compañía realizará un mantenimiento a


todas las máquinas ensambladoras de la línea 1. ¿Cuál es la decisión que se debe tomar?

Tercera reunión.

Otro problema que deben corregir es cómo lograr una textura e impermeabilidad en el vaso
que sea comparable a las características de uno de vidrio (generalmente es deseable un
índice de 5.9 o mayor). Para ello se probaron tres métodos en cada inyectora de plástico de
las dos líneas de ensamble. Los resultados del índice de textura e impermeabilidad, son:

Línea de ensamble 1 Línea de ensamble 2


Máquina 1 Máquina 2 Máquina 3 Máquina 4
Método 1 5.6 6.5 4.9 4.5
Método 2 5.1 5.0 4.8 4.6
228
Método 3 6.9 6.8 5.2 5.4

El equipo quiere probar las siguientes hipótesis, con un nivel de riesgo del 0.05, sabiendo
que las muestras provienen de una población normal, con varianzas iguales.

a) ¿Existe relación entre el método que se use para formar el material del vaso y el tipo de
máquina inyectora?
b) Si no existe relación, el equipo podrá realizar un análisis para comprobar qué método es
el más efectivo para lograr un índice de textura similar al que tienen un vaso de vidrio.
¿Se puede realizar el análisis? Si la respuesta es afirmativa, hágalo. ¿Qué método
sugeriría como el más efectivo? ¿Existe diferencia significativa en la efectividad de las
máquinas inyectoras?

Cuarta reunión.

Otra importante cuestión es analizar los costos unitarios de producción, que en la actualidad
se cree que son muy variables en cada mes, para reducirlos al máximo. Los datos históricos
de varios meses, en $us, son:

Costos ($us/unidad) Número de


licuadoras
producidas
60 – 63 150
63’ – 65 300
65’ – 68 340
68’ - 70 120

El equipo quiere establecer si los datos se pueden modelar por medio de una distribución
normal, cuya desviación estándar sea de 2.3 $us. Pruebe la hipótesis a un nivel de 0.05.

229
BIBLIOGRAFÍA

• La Estadística en Cómic. Larry Gonick y Woollcott Smith. Primera Edición, 1999. Editorial
Zendrera Zariquiey.

• Estadística para Administradores. Richard I. Levin & David S. Rubin. Sexta Edición, 1996.
Prentice Hall Hispanoamericana S.A. México.

• Estadística para Administración y Economía. Mason y Lind. Séptima Edición, 1995.


Alfaomega, México.

• Estadística. Murray R. Spiegel. Serie Schaums. Segunda Edición, 1995. Edit. Mc. Graw -
Hill.

• Estadística Elemental. Freund y Simon. Octava Edición. 1994. Prentice Hall, México.

• Probabilidad y Estadística para Ingenieros. Miller, Freund y Jonson. Cuarta Edición, 1992.
Editorial Prentice Hall Hispanoamericana S.A.

• Estadística para Administradores. William Mendenhal. Segunda Edición, 1990. Grupo


Editorial Iberoamérica, México.

• Introducción a la Estadística Sociológica. Manuel García Ferrando. 1985. Editorial Alianza,


Madrid-España.

• Estadística General Aplicada. Fadil H. Zuwaylif. 1985. Fondo Educativo Interamericano.

• Estadística. Nivel universitario. Horacio D’ottone R. 1982. Cooperativa de Cultura


Publicaciones y Multiactiva Ltda. Santiago-Chile.

• Estadística Social. Hubert M. Blalock. Segunda Edición, 1981. Fondo de Cultura


Económica, México.

• Probabilidad y Estadística en Ingeniería Civil. Jack R. Benjamín. Primera Edición. 1981.


Editorial McGraw Hill Latinoamericana, Colombia.

• Introducción a las Técnicas de Investigación Social. Ezequiel Ander-Egg. Sexta Edición,


1977. Editorial Humanitas, Buenos Aires-Argentina.

• Introducción a la Inferencia Estadística. William G Guenther. 1977. Editorial Mc Graw Hill,


México.

• Introducción a la Teoría Estadística. Mood/Graybill. Cuarta Edición, 1976. Editorial Aguilar,


Madrid-España.

229
• Estadística Básica para Planificación. Arturo Núñez del Prado Benavente. Cuarta Edición,
1975. Siglo XXI Editores S.A., México.

• Estadística. Taro Yamane. Tercera Edición, 1974. Editorial Harla, S.A. e C.V, México.

• Probabilidad y Estadística. Louis Maisel. Fondo Educativo Interamericano, S.A. Bogotá-


Colombia.

• Estadística y Sociología. Manuel Mora y Araujo y Otros. 1973. Ediciones Nueva Visión,
Buenos Aires-Argentina.

• Statistics. Probability, Inference, And Decision. William L Hays & Robert L. Winkler. 1970.
Holt, Rinehart and Winston, Inc. New York-United States of America.

• Curso de Estadística General. Enrique Cansado. Segunda Edición, 1970. Centro


Interamericano de Enseñanza Estadística (CIENES), Santiago-Chile.

• Manual de Estadística. Basilio Giardina. Primera Edición, 1968. Compañía Editorial


Continental, S.A., México.

• Estadística Aplicada. Cortada y Carro. Segunda Edición, 1968. Editorial Universitaria de


Buenos Aires.

• Estadística y Observación Económica. André Piatier. 1967. Editorial Ariel, Barcelona-


España.

• Práctica de las Encuestas Estadísticas. Gabriel R Chevry. 1967. Ediciones Ariel, Barcelona-
España.

• Doscientos Problemas de Estadística Descriptiva. Ernesto Casa Aruta. Primera Edición,


1965. Editorial Vicens-Vives, Barcelona-España.

230
ANEXO 1

DISTRIBUCIONES DE DENSIDAD

1. INTRODUCCIÓN

Se mostrará en este anexo algunas distribuciones de densidad que están relacionadas a la


normal, y que constituyen herramientas básicas y muy útiles en la inferencia estadística.

Las funciones probabilísticas que se estudiarán son: La t de Student, la Chi-Cuadrada y la F


de Fisher.

2. LA DISTRIBUCIÓN t DE STUDENT

2.1. Características

La función de densidad de la t de Student, con v grados de libertad, es:

ν +1 
Γ  1+ν 
  t 2  − 2 
f (t ) = 
2 
1 +  para −∞ < t < ∞ y ν > 0
ν   ν 
πν Γ  
 2

donde: Γ , es la función gamma.

La forma de la t de Student es parecida a la normal:

α 1−α α
2 2

−tα , n−1 tα ,n−1 t


2 2

Al igual que la distribución normal estándar, la distribución t es simétrica y unimodal, pero


con mayores colas, puesto que tiene mayor variabilidad. La forma límite de la distribución t (a
medida que los grados de libertad aumentan) es la normal. Para los estadísticos esta forma
límite se consigue cuando la muestra es mayor a 30 elementos.

Por lo dicho anteriormente, el estadístico de prueba que se usa para muestras menores a 30
(con σ desconocida) y que mejor se ajusta para la inferencia es la distribución t:

x −µ
t=
s
n
231
2.2. Uso de la tabla t

Así como existe una tabla normal estándar, también existe una tabla t de Student estándar. A
continuación se muestran algunos ejemplos para manejarla.

Ejemplo.

Sea t una variable aleatoria con distribución t de Student y 10 grados de libertad. Encuentre
un valor crítico para un nivel de significancia del 5%, considerando solo la cola derecha.

Resolución.

Gráficamente, se tiene:

1 − α = 0.95 α = 0.05

t0.05,10 t
Se busca en la tabla t, el valor para t0.05,10 :

α 0.40 .................................. 0.05


v

1
2
.
.
.

10 1.8125

3. LA DISTRIBUCIÓN CHI-CUADRADA

3.1. Características

La función de densidad de una variable aleatoria que tiene distribución Chi-Cuadrada, con ν
grados de libertad, es:

ν  ν 
1  −1 −  
f (χ ) = ν 
χ  2   2
e para χ > 0 y ν > 0
ν   
Γ   2 2 
2

La distribución tiene sesgo a la derecha, y sus valores son siempre positivos. Sin embargo,
al aumentar los grados de libertad, la forma límite es la distribución normal.

232
α
1−α α
2 2

χ2
χ12− α ,n −1 χ α2,n −1
2 2

El estadístico de prueba, para obtener una variable aleatoria estándar, es el siguiente:

(n − 1)s 2
χ2 =
σ2

el cual, permite relacionar la varianza de una muestra tomada de una población normal, con
una variable aleatoria con densidad conocida.

3.2. Uso de la tabla Chi-Cuadrada

Se muestra a continuación la manera de usar la tabla Chi-Cuadrada.

Ejemplo.

Sea una variable aleatoria que se distribuye mediante la Chi-Cuadrada y tiene 8 grados de
libertad. Encuentre un valor crítico para un nivel de significancia de 0.05.

Resolución.

Un gráfico ayudará a fijar el valor crítico que deberá ser hallado en la tabla.

1 − α = 0.95 α
2 = 0.05
χ2
2
χ 0.05,8
Se buscará en la tabla el valor crítico: χ 20.05,8 :

α 0.995 ................................ 0.05


v

1
2
.
.
.

8 15.5073

233
4. LA DISTRIBUCIÓN F DE FISHER

4.1. Características

La función de densidad de una variable aleatoria con ν 1 grados de libertad en el numerador y


ν 2 grados de libertad en el denominador es:

 ν +ν 
Γ  1 2   ν1   ν1   ν1 −1 ν +ν
 2  ν  2 ν  2  F  2  ν + ν F − 1 2 2 
f (F ) = 1 2 ( 2 1 ) para ν 1 ,ν 2 , F > 0
ν  ν 
Γ 1 Γ 2 
2  2

La forma de la distribución F estándar es parecida a la Chi-Cuadrada:

α 1−α α
2 2
F
F1− α ,n1 −1,n2 −1 Fα ,n1 −1,n2 −1
2 2

El estadístico de prueba, que se usa para relacionar varianzas de dos poblaciones normales
es:

s12
σ 12
F= 2
s2
σ 22

4.2. Uso de las Tablas F

Como el número de variables aumenta (hay dos grados de libertad), existen 5 tablas F, cada
una para diferentes valores de α : 0.25, 0.10, 0.05, 0.025 y 0.01. Para valores mayores a
0.25, existe una relación que permite el cálculo, con las mismas tablas:

1
Fα ,ν1 ,ν 2 =
F1−α ,ν 2 ,ν1

Ejemplo.

Sea F una variable aleatoria con distribución F, con 14 grados de libertad en el numerador y
10 grados de libertad en el denominador. Encuentre un valor crítico con un nivel de
significancia de 0.975.

234
Resolución.

Como el valor de α es mayor a 0.25, entonces se usará la relación para transformarlo:

1
F0.975,14,10 =
F0.025,10,14

1 − α = 0.025 α = 0.975
F
F0.975,14,10
Observando en la tabla respectiva, se halla el valor crítico:

F0.025
ν1 1 2 3 ............. 10
ν2

1
2
.
.
.

14 3.15

Por lo tanto el valor es:

1 1
F0.975,14,10 = = = 0.317
F0.025,10,14 3.15

235
ANEXO 2

TRABAJO DE APLICACIÓN FINAL

1. OBJETIVOS DEL TRABAJO

El estudiante será capaz de plantearse un problema real en la que use algún método de
inferencia estadística para su resolución, tal como las pruebas de hipótesis, los intervalos
de confianza, pruebas no paramétricas o análisis de varianza.

2. NÚMERO DE COMPONENTES DEL GRUPO

Máximo 5 personas. No es negociable.

3. FECHA DE ENTREGA

Día del examen final impostergablemente.

4. CARÁTULA

Deberá ir especificado el nombre de la Universidad, la materia que cursan, el título del


trabajo, los nombres de los componentes del grupo, el nombre del catedrático de la
materia, y la fecha de realización.

Nota: El título del trabajo no es: “Trabajo de aplicación final”, sino debe ser específico,
indicando el tema en el cual se ha desarrollado el trabajo. Ejemplo: “Análisis de la eficiencia
de atención en Burger King”.

5. CONTENIDO

El trabajo deberá contar con los siguientes puntos:

1. Antecedentes.

Se debe relatar cuales son las causas, oportunidades y circunstancias por las cuales los
alumnos se decidieron a realizar el trabajo.

2. Justificación.

Se debe indicar por qué el tema propuesto es de interés para los alumnos.

3. Objetivos.

Se debe describir cuáles son los propósitos de la investigación que se realizará. Existirán
objetivos generales y específicos.

236
4. Hipótesis.

Se debe manifestar cuáles son las hipótesis generales y específicas que los alumnos
quieren probar con la investigación a realizar.

5. Metodología de investigación.

Se debe enumerar los pasos que los alumnos tendrán que realizar para desarrollar la
investigación propuesta.

6. Desarrollo de la investigación.

Se deberá desarrollar en base a los puntos descritos en metodología de investigación, y


son:

1. Determinación de la población, en naturaleza y número.


2. Determinación y clasificación de las características de la población que se desean
estudiar.
3. Determinación del tipo de muestreo probabilístico adecuado.
4. Determinación del método de recopilación de datos adecuado (observación, entrevista o
cuestionario).
5. Determinación del tamaño muestral. Cálculo del error de estimación.
6. Elaboración del formulario (de la encuesta o entrevista) o metodología de observación.
7. Recopilación de datos (Aplicación de la encuesta, entrevista u observación).
8. Tabulación de datos: organización, presentación, resumen mediante estadígrafos de
posición y dispersión, interpretación y conclusiones (Estadística descriptiva)
9. Determinar y realizar los tipos de prueba de hipótesis a usar o los intervalos de
confianza, que den una solución al problema planteado, dependiendo si se está
realizando un estudio exploratorio, descriptivo o causal.
9. Análisis e interpretación de los resultados.
10. Sugerencias y recomendaciones.

6. BIBLIOGRAFÍA

Si el grupo usó alguna bibliografía o fuente para recopilar datos o realizar algún
procedimiento, deberá estar detallada en el trabajo.

7. BANCO DE TEMAS

1. Análisis de la situación de desempeño de los alumnos de la UPB: número de materias,


materias fuertes, número de materias por mes, debido a la calidad docente,
circunstancias familiares, nivel promedio de notas, tiempo de estudio extra aula, etc.
Comparación de estos índices con diferentes años, con diferentes carreras, con
diferentes semestres o según el sexo, ausentismo o abandono de materias, etc.
2. Análisis de desempeño de una máquina llenadora de refrescos o de cualquier
instrumento de medición: análisis de la cantidad promedio de llenado, análisis de su
variabilidad, comparación de su eficiencia con otra máquina similar, etc.

237
3. Análisis del rendimiento del auto de un estudiante: rendimiento promedio en
combustible, variabilidad del rendimiento en combustible, vida media de las llantas y su
variabilidad, comparación de estas variables con otro auto similar, proporción de
repuestos cambiados desde su compra, etc.
4. Análisis de uso de internet entre los estudiantes de la UPB: promedio de horas de uso,
buscador más utilizado, tema mas buscado, según carrera, según sexo, etc.
5. Análisis de los factores por los cuales las materias de análisis de decisiones I y II son
difíciles de aprobar.
6. Análisis del nivel de gastos promedio de un estudiante de la UPB: según el mes, según
la edad, según la carrera, según la ocasión, etc.
7. Análisis de la variabilidad de las calificaciones de exámenes de dos estudiantes de la
UPB de la misma carrera y que están en un mismo nivel.
8. Dependencia o independencia entre rendimiento y edad de los estudiantes de una
materia.
9. Dependencia o independencia entre rendimiento y la carrera de los estudiantes de una
materia.
10. Dependencia o independencia entre rendimiento y colegio de los estudiantes del
preuniversitario.
11. Bondad de ajuste de la distribución de puntajes de las evaluaciones docentes a una
distribución teórica como la binomial.
12. Relación (prueba de independencia) entre el desempeño de un empleado, ej: un
docente, y su grado de conocimiento de la visión, misión, propósito, valores y principios
y/o reglamentos de su organización.
13. Comprobar si dos o más métodos de estudio usados por un estudiante o por diversos
estudiantes, son igual de efectivos para vencer una determinada materia o un grupo de
materias.

Nota: Los temas mencionados en esta lista son alternativas que se sugieren para
desarrollar el trabajo, pero de ninguna manera son limitantes para que los alumnos no
puedan escoger un tema de interés o actual.

8. EJEMPLO DE TRABAJO FINAL

A continuación se presenta un trabajo de asesoría realizado por el autor a una empresa de


electricidad, como ejemplo de trabajo final. Los alumnos deben tomar en cuenta que este
es un trabajo muy específico, y el que tendrán que desarrollar debe ser mucho más amplio,
para poder aplicar todas las pruebas y métodos desarrollados en el texto.

Cabe aclarar que no se nombra la empresa, ni el lugar donde se desarrolló la investigación,


además que los datos fueron alterados, para proteger la información.

238
INFORME DE ASESORÍA PARA UNA
EMPRESA DE ELECTRICIDAD X

ESTIMACIÓN DE LA PROPORCIÓN DE TRANSFORMADORES

CON PROBLEMAS DE TENSIÓN Y SATURACIÓN

EN UNA CIUDAD X

INTRODUCCIÓN.

La división de planificación de la empresa X, ha solicitado asesoramiento estadístico para la


validación de una encuesta realizada para determinar problemas de tensión y saturación en
transformadores de distintos sistemas de la ciudad X.

OBJETIVOS.

• Realizar una validación estadística de los resultados de una encuesta realizada por el
departamento de planificación de la empresa X.
• Realizar una inferencia a la población sobre las características de la muestra requeridas
por el estudio realizado por la empresa X.
• Otorgar un sustento teórico y metodología adecuada en la validación e inferencia.

METODOLOGÍA.

Para la realización de este estudio de asesoría se realizaron los siguientes pasos:

1. Determinación de la población, en naturaleza y número.


2. Determinación y clasificación de las características de la población que se desean
estudiar.
3. Determinación del tipo de muestreo probabilístico adecuado.
4. Determinación del método de recopilación de datos adecuado.
5. Determinación del tamaño muestral. Cálculo del error de estimación.
6. Recopilación de datos.
7. Cálculo del intervalo de confianza para estimar la proporción de la población.
8. Análisis e interpretación de los resultados.
9. Recomendaciones.

1. DETERMINACIÓN DE LA POBLACIÓN, EN NATURALEZA Y NÚMERO.

Fundamento teórico.
239
La población, colectivo o universo es el total de elementos, cosas o personas que forman
parte de la investigación.
La población puede considerarse por sus elementos como:

a) Población finita. Conjunto numerable de elementos.

b) Población infinita. Conjunto no numerable o forma línea continua de puntos. Esta


distinción es teórica ya que siempre se trata con poblaciones de
números finitos de elementos.

Aplicación.

La población es finita, y está constituida por los transformadores llamados “exclusivos”, que
posee la empresa X en los tres sistemas de la ciudad X. El tamaño de la población de cada
sistema es el siguiente:

Sistema 1: 1613 transformadores.


Sistema 2: 1898 transformadores.
Sistema 3: 245 transformadores.

2. Determinación y clasificación de las características de la población que se desean


estudiar.

Fundamento teórico.

Las características de la población son rasgos distintivos de los elementos de una


población. Pueden ser de carácter cualitativo o cuantitativo, de ahí la distinción en: variable
o atributo.

a) Atributos. Son rasgos cualitativos de los elementos de una población. Pueden ser:

• Ordinales. Referente al sentido de jerarquización u organización de


elementos. Ejemplo: grados militares, cargos en una empresa, etc.
• Nominales. Rasgos sin capacidad de ordenación. Ejemplo: color de ojos,
gusto, etc.

A las diferentes clasificaciones que pueden adoptar los atributos se les llaman modalidades.
Los atributos se designan con las primeras letras mayúsculas del abecedario (A, B, C, etc.);
las modalidades con las minúsculas (a, b, c, etc.).

b) Variables. Son rasgos, características o propiedades cuantificables. Ejemplo: peso,


edad, altura, etc. Las variables pueden ser:

• Discretas. Si entre dos valores consecutivos no puede introducirse otro.


Ejemplo: el número de mesas, sillas, casas, etc.
• Continuas. Si entre dos valores consecutivos pueden introducirse infinitos
valores. Ejemplo: altura, peso, etc.
240
Las variables se designan con las últimas letras mayúsculas del abecedario (X, Y, Z, etc.) y
sus valores con las minúsculas (x, y, z, etc.).

Niveles de medición.

a) Nivel Nominal

Es el nivel más primitivo, bajo y limitado de medición. Este nivel hace referencia a los datos
que solo pueden clasificarse en categorías, sin intervención de mediciones o escalas, solo
mediante conteos. Para este nivel no existe orden particular para los grupos. Las categorías
o modalidades se consideran mutuamente excluyentes y exhaustivas. Es el nivel de
medición para atributos nominales.

b) Nivel ordinal

Tiene las características del nivel anterior, pero difiere en que las categorías pueden
ordenarse en una relación “mayor que”. Es el nivel de medición para atributos ordinales.

c) Nivel de intervalo

Incluye todas las características de la escala ordinal, pero además la distancia entre valores
es de tamaño conocido y constante. Es el nivel de medición para variables discretas o
continuas.

Ejemplo: Medición de temperatura en la escala centígrada. En esta escala el punto cero es


arbitrario: 0 °C; no significa que haya ausencia de temperatura, sino solo un estado de frío.
Si se registraron las siguientes temperaturas: 30 °C y 60 °C, puede decirse que en la
segunda oportunidad hubo una temperatura 30 °C más cálida, pero no se puede afirmar
que haga 2 veces más calor.

d) Nivel de razón (o cociente)

Es el nivel de medición más alto y sirve para variables discretas y continuas. Las principales
diferencias entre el anterior nivel y éste son:

1. Los datos de nivel de razón tienen un punto cero significativo.


2. La razón o cociente de dos números es significativa.

Ejemplo: El dinero. Tener cero pesos tiene un significado: no tengo nada de dinero. Si una
persona gana 1000 $us y otra 4000 $us, la segunda gana 4 veces más que la primera.

Aplicación.

Las características de los transformadores que la empresa X ha estudiado son:

• La tensión
241
• La saturación.

La empresa quiere determinar los transformadores que tienen problemas de tensión.


Mediante mediciones técnicas pueden determinar cuáles no cumplen con los niveles
estándares aceptables. También quieren determinar qué transformadores están saturados,
es decir los que están operando por encima de su capacidad nominal.
Ambas características se las clasifica como variables continuas y el nivel de medición que
se usa debe ser el de razón.

3. Determinación del tipo de muestreo probabilístico adecuado.

Fundamento teórico.

La muestra es un subconjunto representativo de la población. Se usa para realizar trabajos


empíricos, en que los universos no son manejables, para reducir costos y ahorrar tiempo,
sin disminuir la calidad de información.

El muestreo estadístico es un enfoque sistemático para seleccionar unos cuantos


elementos representativos (una muestra) de un grupo de datos, a fin de hacer algunas
inferencias sobre el grupo total (población). Como esta muestra aporta datos bastantes
confiables, no es necesario seleccionar el total.

Hay dos tipos de muestreo:

• probabilístico o aleatorio, cuando la muestra se selecciona de modo que cada


integrante de la población tenga una probabilidad conocida de ser incluido en la
muestra.

• no probabilístico o de juicio, cuando no todos los integrantes tienen alguna


probabilidad de ser incluidos en la muestra. Se usa el conocimiento y la opinión
personal para identificar los elementos de una población que se van a incluir en la
muestra.

Métodos de muestreo aleatorio.

Los métodos de muestreo aleatorio tienen el objetivo de permitir que el azar determine los
integrantes de la muestra. Son:

• Muestreo aleatorio simple. En él, se seleccionan las muestras mediante métodos


que permiten a cada muestra tener igual probabilidad de ser seleccionada y a
cada elemento de la población tener igual probabilidad de quedar incluido en la
muestra. Para este fin se utilizan las tablas de números aleatorios.

• Muestreo sistemático. Difiere del simple en que cada elemento tiene igual
probabilidad de ser seleccionado, pero cada muestra no tiene esa misma
posibilidad. En este muestreo se seleccionan los elementos de la población con
un intervalo uniforme en el tiempo, en el orden o en el espacio.

242
• Muestreo estratificado. Para aplicarlo dividimos la población en grupos
homogéneos relativos, llamados estratos.

• Muestreo por conglomerados. Para aplicarlo dividimos la población en grupos o


conglomerados y luego seleccionamos una muestra aleatoria de ellos.

Aplicación.

La empresa realizó el tipo de muestreo probabilístico denominado: Muestreo aleatorio


simple. Es decir que todos los transformadores de la población tenían la misma probabilidad
de estar incluidos en la muestra.

4. Determinación del método de recopilación de datos adecuado.

Fundamento teórico.

En la investigación científica, existen tres métodos de recolección de datos a partir de una


muestra o población: la observación, la entrevista y el cuestionario. Cada uno de ellos se
adapta a las exigencias de las diferentes disciplinas, presentando ventajas y desventajas.

La observación.

Se ha dicho que la observación es el procedimiento más antiguo y moderno a la vez. Sirve


a un objeto ya formulado de investigación, es planificada y controlada sistemáticamente y
relacionada con proporciones más generales. Consiste en ver y oír hechos y fenómenos
que se desean estudiar.

Según medios utilizados la observación puede ser:

• No estructurada. También llamada observación simple o libre. Consiste en reconocer


y anotar hechos sin recurrir a la ayuda de medios técnicos.
• Estructurada o sistemática. Apela a instrumentos para la recopilación de datos o
hechos establecidos de antemano, para saber qué aspectos se van a estudiar
(cuadros, anotaciones, dispositivos mecánicos).

Las ventajas y desventajas son:

• Ventajas. Los fenómenos se analizan con un carácter de totalidad. Los hechos se


estudian sin intermediarios.
• Limitaciones. Distinguir entre hechos observados y la interpretación personal. Cada
individuo tiene una forma distinta de observar.

Aplicación.

La empresa utilizó para hallar problemas de tensión y saturación el método de la


observación estructurada, ya que tuvo que realizar mediciones en cada transformador con
instrumentos adecuados para tales fines.
243
5. Determinación del tamaño muestral. Cálculo del error de estimación.

Fundamento teórico.

La ecuación para determinar el tamaño de una muestra cuando se quiere realizar una
estimación de la proporción de una población infinita es la siguiente:
2
Z 
n0 = pˆ (1 − pˆ )  α / 2 
 e 
donde:

X
p̂ es la proporción muestral de la categoría éxito y se halla mediante: pˆ = (X es el
n
número de elementos éxito de la muestra y n el tamaño muestral).
q̂ es la proporción muestral de la categoría fracaso y es igual a 1 − pˆ
Z es el valor crítico que corresponde a la probabilidad de encontrar la proporción de la
población en un intervalo, y se halla mediante la tabla normal estándar.
e es el máximo error que se puede cometer al estimar la proporción poblacional.

La ecuación para determinar el tamaño de una muestra, para poblaciones finitas es:

n0 N
n=
n0 + ( N − 1)

donde:

n0 es el tamaño de la muestra para poblaciones infinitas.


N es el tamaño de la población.

Combinando las dos ecuaciones anteriores, se tiene:

ˆ ˆ 2N
pqz
n=
ˆ ˆ 2 + e 2 ( N − 1)
pqz

que es la ecuación a usar para determinar el tamaño de la muestra para estimar la


verdadera proporción de una población finita.

Aplicación.

Los datos para hallar el error máximo que se puede cometer en este estudio son:

Sistema 1:

Tamaño de la población: 1613 Tamaño muestral: 93

244
Sistema 2:

Tamaño de la población: 1898 Tamaño muestral: 94


Sistema 3:

Tamaño de la población: 245 Tamaño muestral: 33

Despejando de la anterior ecuación el error, se tiene:

ˆ ˆ 2 ( N − n)
pqz
e=
n( N − 1)

Otros datos que se necesitan son:

pˆ = 0.5 y qˆ = 0.5 , suponiendoque existe la misma probabilidad de que los


transformadores muestreados tengan problemas de tensión o de
saturación.

z = 1.96, suponiendo que existe una probabilidad del 95% de encontrar la verdadera
proporción de la población en un intervalo.

El máximo error que se comete en los distintos sistemas es:

Sistema 1:

Tamaño de la población: 1613 Tamaño muestral: 93 Error: 10%

Sistema 2:

Tamaño de la población: 1898 Tamaño muestral: 94 Error: 10%

Sistema 3:

Tamaño de la población: 245 Tamaño muestral: 33 Error: 16%

Se puede observar que por alguna razón, el error en el sistema 3 es más alto que en los
otros dos sistemas.

6. Recopilación de datos.

Aplicación.

Los datos muestrales que se recopilaron son los siguientes, para cada sistema:

Sistema 1:

245
Problemas de tensión: 14 Problemas de saturación: 6

Sistema 2:

Problemas de tensión: 2 Problemas de saturación: 0


Sistema 3:

Problemas de tensión: 0 Problemas de saturación: 1

7. Cálculo del intervalo de confianza para estimar la proporción de la población.


Fundamento teórico.

Inferencia estadística.

Es la rama de la Estadística que se ocupa del uso de los conceptos de la probabilidad para
afrontar la incertidumbre en la toma de decisiones. Los conceptos básicos de las
distribuciones muestrales, sirven como base para la estadística inferencial. Esta comprende
dos áreas:

• La estimación, que consiste en estimar los valores de los parámetros de la


población bajo estudio.

• Las pruebas de hipótesis, que constituyen el proceso de aceptar o rechazar


declaraciones, generalmente relacionadas con parámetros poblacionales.

Tipos de estimaciones.

Un estimador es un estadístico muestral con el cual se estima un parámetro de la población.


Una estimación es un valor específico observado de un estadístico.

En la vida real se desconocen los valores de los parámetros de las poblaciones que se
estudian. Se pretende entonces estimar estos valores que son de interés en nuestro
estudio. Para esto puede hacerse una:

• Estimación puntual, que es un valor único que pretende estimar el valor del
parámetro poblacional estudiado.

Dos estimadores puntuales que utilizamos con frecuencia en estadística son: la


media muestral
1 n
x= ∑x
n i=1 i
como estimador de la media poblacional, y la varianza muestral
1 n 2
2
S = ∑
n − 1 i= 1
( x i − x)

como estimador de la varianza poblacional.

246
• Estimación por intervalo, que es un intervalo numérico en donde se pretende se
encuentra el valor del parámetro bajo estudio.

Estimación por intervalos.

Una desventaja de los estimadores puntuales, es que no sabemos que tan cerca se
encuentran del valor del parámetro que estiman. No tenemos ninguna medida que nos
indica que tan precisa es nuestra estimación.

Con el fin de obtener alguna medida de la precisión en nuestra estimación, se utiliza la


estimación por intervalos. El objetivo es determinar un intervalo de valores (intervalo de
confianza), el cual incluirá el valor del parámetro con una probabilidad prefijada (1 - α),
donde “α”, es la probabilidad de que el intervalo no contenga al verdadero valor del
parámetro, y es denominado nivel de significancia o riesgo.

El intervalos de confianza para estimar la verdadera proporción de la población, es:

 pˆ (1 − p)
ˆ ˆ 
pˆ (1 − p)
P =  pˆ - Z α * ≤ p ≤ p+
ˆ Zα *  = 1 - α
 2 n 2 n 

Aplicación.

Con la información muestral se procede a calcular las proporciones muestrales para cada
sistema y característica:

Sistema 1:

14
Proporción con problemas de tensión: pT = = 0.15054
93
6
Proporción con problemas de saturación: pS = = 0.06452
93

Sistema 2:

2
Proporción con problemas de tensión: pT = = 0.02128
94
0
Proporción con problemas de saturación: pS = =0
94

Sistema 3:

0
Proporción con problemas de tensión: pT = =0
33

247
1
Proporción con problemas de saturación: pS = = 0.03030
33

Por último se calcula los intervalos de confianza para cada proporción en cada sistema,
mediante la fórmula:
 pˆ (1 − p)
ˆ ˆ 
pˆ (1 − p)
P =  pˆ - Z α * ≤ p ≤ p+
ˆ Zα *  = 1 - α
 2 n 2 n 

Sistema 1:

Intervalo de confianza para estimar la proporción de la población con problemas de tensión:

 0.15054 (1 − 0.15054) 0.15054 (1 − 0.15054) 


P =  0.15054 -1.96 ≤ p ≤ 0.15054 +1.96  = 95%
 93 93 
P = ( 7.8% ≤ p ≤ 22.3%) = 95%

Se puede decir que hay una probabilidad del 95% de que la proporción de la población de
transformadores con problemas de tensión esté entre 7.8% y 22.3%.

Intervalo de confianza para estimar la proporción de la población con problemas de


saturación:
P = (1.5% ≤ p ≤ 11.4%) = 95%

Existe una probabilidad del 95% de que la proporción de la población de transformadores


con problemas de saturación esté entre 1.5% y 11.4%.

Sistema 2:

Intervalo de confianza para estimar la proporción de la población con problemas de tensión:

P = ( 0% ≤ p ≤ 5.0%) = 95%

Se puede decir que hay una probabilidad del 95% de que la proporción de la población de
transformadores con problemas de tensión esté entre 0% y 5.0%.

Intervalo de confianza para estimar la proporción de la población con problemas de


saturación:
P = ( 0% ≤ p ≤ 0%) = 95%

Existe una probabilidad del 95% de que la proporción de la población de transformadores


con problemas de saturación sea del 0%.

248
Sistema 3:

Intervalo de confianza para estimar la proporción de la población con problemas de tensión:

P = ( 0% ≤ p ≤ 0%) = 95%

Se puede decir que hay una probabilidad del 95% de que la proporción de la población de
transformadores con problemas de tensión esté entre 0% y 0%.

Intervalo de confianza para estimar la proporción de la población con problemas de


saturación:

P = ( 0% ≤ p ≤ 8.9%) = 95%
Existe una probabilidad del 95% de que la proporción de la población de transformadores
con problemas de saturación esté entre el 0% y 8.9%.

8. Análisis e interpretación de los resultados.

Aplicación.

La empresa X quiere saber el número de transformadores de la población que tienen


problemas de tensión y saturación. Por lo tanto vamos a determinar los intervalos de
confianza no en proporciones, sino en valores.

Sistema 1. Población: 1613

Existe una probabilidad del 95% de que el número de transformadores con problemas de
tensión sea de 126 a 360.

Existe una probabilidad del 95% de que el número de transformadores con problemas de
saturación sea de 24 a 185.

Se determinó que el máximo error que se pudo cometer en esta estimación es del 10%.

Sistema 2. Población: 1898

Existe una probabilidad del 95% de que el número de transformadores con problemas de
tensión sea de 0 a 96.

Existe una probabilidad del 95% de que el número de transformadores con problemas de
saturación sea de 0.
Se determinó que el máximo error que se pudo cometer en esta estimación es del 10%.

Sistema 3. Población: 245

Existe una probabilidad del 95% de que el número de transformadores con problemas de
tensión sea de 0.
249
Existe una probabilidad del 95% de que el número de transformadores con problemas de
saturación sea de 0 a 22.

Se determinó que el máximo error que se pudo cometer en esta estimación es del 16%.

9. Recomendaciones.

Se recomienda a la empresa X que amplié el tamaño de su muestra en los tres sistemas,


sobre todo en el 3, para que el máximo error en la estimación de la verdadera proporción de
la población sea del 5% en cada caso, error que es recomendable estadísticamente, y
vuelva a realizar los cálculos respectivos.

250
x
Tabla I - Distribución Binomial Acumulada: B(x; n, p) = ∑  n  p k (1 − p) n −k
k=0 k
P
N x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 0.2025 0.1600 0.1225 0.0900 0.0625 0.0400 0.0225 0.0100 0.0025
1 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500 0.6975 0.6400 0.5775 0.5100 0.4375 0.3600 0.2775 0.1900 0.0975

3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250 0.0911 0.0640 0.0429 0.0270 0.0156 0.0080 0.0034 0.0010 0.0001
1 0.9928 0.9720 0.9393 0.8960 0.8438 0.7840 0.7183 0.6480 0.5748 0.5000 0.4253 0.3520 0.2818 0.2160 0.1563 0.1040 0.0608 0.0280 0.0072
2 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750 0.8336 0.7840 0.7254 0.6570 0.5781 0.4880 0.3859 0.2710 0.1426

4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625 0.0410 0.0256 0.0150 0.0081 0.0039 0.0016 0.0005 0.0001 0.0000
1 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 0.5630 0.4752 0.3910 0.3125 0.2415 0.1792 0.1265 0.0837 0.0508 0.0272 0.0120 0.0037 0.0005
2 0.9995 0.9963 0.9880 0.9728 0.9492 0.9163 0.8735 0.8208 0.7585 0.6875 0.6090 0.5248 0.4370 0.3483 0.2617 0.1808 0.1095 0.0523 0.0140
3 1.0000 0.9999 0.9995 0.9984 0.9961 0.9919 0.9850 0.9744 0.9590 0.9375 0.9085 0.8704 0.8215 0.7599 0.6836 0.5904 0.4780 0.3439 0.1855

5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313 0.0185 0.0102 0.0053 0.0024 0.0010 0.0003 0.0001 0.0000 0.0000
1 0.9774 0.9185 0.8352 0.7373 0.6328 0.5282 0.4284 0.3370 0.2562 0.1875 0.1312 0.0870 0.0540 0.0308 0.0156 0.0067 0.0022 0.0005 0.0000
2 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 0.6826 0.5931 0.5000 0.4069 0.3174 0.2352 0.1631 0.1035 0.0579 0.0266 0.0086 0.0012
3 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.8125 0.7438 0.6630 0.5716 0.4718 0.3672 0.2627 0.1648 0.0815 0.0226
4 1.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0.9898 0.9815 0.9688 0.9497 0.9222 0.8840 0.8319 0.7627 0.6723 0.5563 0.4095 0.2262

6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156 0.0083 0.0041 0.0018 0.0007 0.0002 0.0001 0.0000 0.0000 0.0000
1 0.9672 0.8857 0.7765 0.6554 0.5339 0.4202 0.3191 0.2333 0.1636 0.1094 0.0692 0.0410 0.0223 0.0109 0.0046 0.0016 0.0004 0.0001 0.0000
2 0.9978 0.9842 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.3438 0.2553 0.1792 0.1174 0.0705 0.0376 0.0170 0.0059 0.0013 0.0001
3 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.6563 0.5585 0.4557 0.3529 0.2557 0.1694 0.0989 0.0473 0.0159 0.0022
4 1.0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.8906 0.8364 0.7667 0.6809 0.5798 0.4661 0.3446 0.2235 0.1143 0.0328
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9982 0.9959 0.9917 0.9844 0.9723 0.9533 0.9246 0.8824 0.8220 0.7379 0.6229 0.4686 0.2649

7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078 0.0037 0.0016 0.0006 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000
1 0.9556 0.8503 0.7166 0.5767 0.4449 0.3294 0.2338 0.1586 0.1024 0.0625 0.0357 0.0188 0.0090 0.0038 0.0013 0.0004 0.0001 0.0000 0.0000
2 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 0.5323 0.4199 0.3164 0.2266 0.1529 0.0963 0.0556 0.0288 0.0129 0.0047 0.0012 0.0002 0.0000
3 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.5000 0.3917 0.2898 0.1998 0.1260 0.0706 0.0333 0.0121 0.0027 0.0002
4 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0.9444 0.9037 0.8471 0.7734 0.6836 0.5801 0.4677 0.3529 0.2436 0.1480 0.0738 0.0257 0.0038
5 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.9375 0.8976 0.8414 0.7662 0.6706 0.5551 0.4233 0.2834 0.1497 0.0444

250
6 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9984 0.9963 0.9922 0.9848 0.9720 0.9510 0.9176 0.8665 0.7903 0.6794 0.5217 0.3017

P
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039 0.0017 0.0007 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.9428 0.8131 0.6572 0.5033 0.3671 0.2553 0.1691 0.1064 0.0632 0.0352 0.0181 0.0085 0.0036 0.0013 0.0004 0.0001 0.0000 0.0000 0.0000
2 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 0.1445 0.0885 0.0498 0.0253 0.0113 0.0042 0.0012 0.0002 0.0000 0.0000
3 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5941 0.4770 0.3633 0.2604 0.1737 0.1061 0.0580 0.0273 0.0104 0.0029 0.0004 0.0000
4 1.0000 0.9996 0.9971 0.9896 0.9727 0.9420 0.8939 0.8263 0.7396 0.6367 0.5230 0.4059 0.2936 0.1941 0.1138 0.0563 0.0214 0.0050 0.0004
5 1.0000 1.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.8555 0.7799 0.6846 0.5722 0.4482 0.3215 0.2031 0.1052 0.0381 0.0058
6 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0.9915 0.9819 0.9648 0.9368 0.8936 0.8309 0.7447 0.6329 0.4967 0.3428 0.1869 0.0572
7 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961 0.9916 0.9832 0.9681 0.9424 0.8999 0.8322 0.7275 0.5695 0.3366

9 0 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020 0.0008 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.9288 0.7748 0.5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.0195 0.0091 0.0038 0.0014 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000
2 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.0898 0.0498 0.0250 0.0112 0.0043 0.0013 0.0003 0.0000 0.0000 0.0000
3 0.9994 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.2539 0.1658 0.0994 0.0536 0.0253 0.0100 0.0031 0.0006 0.0001 0.0000
4 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.5000 0.3786 0.2666 0.1717 0.0988 0.0489 0.0196 0.0056 0.0009 0.0000
5 1.0000 0.9999 0.9994 0.9969 0.9900 0.9747 0.9464 0.9006 0.8342 0.7461 0.6386 0.5174 0.3911 0.2703 0.1657 0.0856 0.0339 0.0083 0.0006
6 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.9102 0.8505 0.7682 0.6627 0.5372 0.3993 0.2618 0.1409 0.0530 0.0084
7 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.9805 0.9615 0.9295 0.8789 0.8040 0.6997 0.5638 0.4005 0.2252 0.0712
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980 0.9954 0.9899 0.9793 0.9596 0.9249 0.8658 0.7684 0.6126 0.3698

10 0 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.0860 0.0464 0.0233 0.0107 0.0045 0.0017 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9885 0.9298 0.8202 0.6778 0.5256 0.3828 0.2616 0.1673 0.0996 0.0547 0.0274 0.0123 0.0048 0.0016 0.0004 0.0001 0.0000 0.0000 0.0000
3 0.9990 0.9872 0.9500 0.8791 0.7759 0.6496 0.5138 0.3823 0.2660 0.1719 0.1020 0.0548 0.0260 0.0106 0.0035 0.0009 0.0001 0.0000 0.0000
4 0.9999 0.9984 0.9901 0.9672 0.9219 0.8497 0.7515 0.6331 0.5044 0.3770 0.2616 0.1662 0.0949 0.0473 0.0197 0.0064 0.0014 0.0001 0.0000
5 1.0000 0.9999 0.9986 0.9936 0.9803 0.9527 0.9051 0.8338 0.7384 0.6230 0.4956 0.3669 0.2485 0.1503 0.0781 0.0328 0.0099 0.0016 0.0001
6 1.0000 1.0000 0.9999 0.9991 0.9965 0.9894 0.9740 0.9452 0.8980 0.8281 0.7340 0.6177 0.4862 0.3504 0.2241 0.1209 0.0500 0.0128 0.0010
7 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9952 0.9877 0.9726 0.9453 0.9004 0.8327 0.7384 0.6172 0.4744 0.3222 0.1798 0.0702 0.0115
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9955 0.9893 0.9767 0.9536 0.9140 0.8507 0.7560 0.6242 0.4557 0.2639 0.0861
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9975 0.9940 0.9865 0.9718 0.9437 0.8926 0.8031 0.6513 0.4013

251
P
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
11 0 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.0005 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8981 0.6974 0.4922 0.3221 0.1971 0.1130 0.0606 0.0302 0.0139 0.0059 0.0022 0.0007 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9848 0.9104 0.7788 0.6174 0.4552 0.3127 0.2001 0.1189 0.0652 0.0327 0.0148 0.0059 0.0020 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000
3 0.9984 0.9815 0.9306 0.8389 0.7133 0.5696 0.4256 0.2963 0.1911 0.1133 0.0610 0.0293 0.0122 0.0043 0.0012 0.0002 0.0000 0.0000 0.0000
4 0.9999 0.9972 0.9841 0.9496 0.8854 0.7897 0.6683 0.5328 0.3971 0.2744 0.1738 0.0994 0.0501 0.0216 0.0076 0.0020 0.0003 0.0000 0.0000
5 1.0000 0.9997 0.9973 0.9883 0.9657 0.9218 0.8513 0.7535 0.6331 0.5000 0.3669 0.2465 0.1487 0.0782 0.0343 0.0117 0.0027 0.0003 0.0000
6 1.0000 1.0000 0.9997 0.9980 0.9924 0.9784 0.9499 0.9006 0.8262 0.7256 0.6029 0.4672 0.3317 0.2103 0.1146 0.0504 0.0159 0.0028 0.0001
7 1.0000 1.0000 1.0000 0.9998 0.9988 0.9957 0.9878 0.9707 0.9390 0.8867 0.8089 0.7037 0.5744 0.4304 0.2867 0.1611 0.0694 0.0185 0.0016
8 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9980 0.9941 0.9852 0.9673 0.9348 0.8811 0.7999 0.6873 0.5448 0.3826 0.2212 0.0896 0.0152
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9978 0.9941 0.9861 0.9698 0.9394 0.8870 0.8029 0.6779 0.5078 0.3026 0.1019
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9995 0.9986 0.9964 0.9912 0.9802 0.9578 0.9141 0.8327 0.6862 0.4312

12 0 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8816 0.6590 0.4435 0.2749 0.1584 0.0850 0.0424 0.0196 0.0083 0.0032 0.0011 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.0193 0.0079 0.0028 0.0008 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9978 0.9744 0.9078 0.7946 0.6488 0.4925 0.3467 0.2253 0.1345 0.0730 0.0356 0.0153 0.0056 0.0017 0.0004 0.0001 0.0000 0.0000 0.0000
4 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4382 0.3044 0.1938 0.1117 0.0573 0.0255 0.0095 0.0028 0.0006 0.0001 0.0000 0.0000
5 1.0000 0.9995 0.9954 0.9806 0.9456 0.8822 0.7873 0.6652 0.5269 0.3872 0.2607 0.1582 0.0846 0.0386 0.0143 0.0039 0.0007 0.0001 0.0000
6 1.0000 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 0.6128 0.4731 0.3348 0.2127 0.1178 0.0544 0.0194 0.0046 0.0005 0.0000
7 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.8062 0.6956 0.5618 0.4167 0.2763 0.1576 0.0726 0.0239 0.0043 0.0002
8 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.9270 0.8655 0.7747 0.6533 0.5075 0.3512 0.2054 0.0922 0.0256 0.0022
9 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.9807 0.9579 0.9166 0.8487 0.7472 0.6093 0.4417 0.2642 0.1109 0.0196
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9968 0.9917 0.9804 0.9576 0.9150 0.8416 0.7251 0.5565 0.3410 0.1184
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9992 0.9978 0.9943 0.9862 0.9683 0.9313 0.8578 0.7176 0.4596

252
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
13 0 0.5133 0.2542 0.1209 0.0550 0.0238 0.0097 0.0037 0.0013 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8646 0.6213 0.3983 0.2336 0.1267 0.0637 0.0296 0.0126 0.0049 0.0017 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9755 0.8661 0.6920 0.5017 0.3326 0.2025 0.1132 0.0579 0.0269 0.0112 0.0041 0.0013 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9969 0.9658 0.8820 0.7473 0.5843 0.4206 0.2783 0.1686 0.0929 0.0461 0.0203 0.0078 0.0025 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000
4 0.9997 0.9935 0.9658 0.9009 0.7940 0.6543 0.5005 0.3530 0.2279 0.1334 0.0698 0.0321 0.0126 0.0040 0.0010 0.0002 0.0000 0.0000 0.0000
5 1.0000 0.9991 0.9925 0.9700 0.9198 0.8346 0.7159 0.5744 0.4268 0.2905 0.1788 0.0977 0.0462 0.0182 0.0056 0.0012 0.0002 0.0000 0.0000
6 1.0000 0.9999 0.9987 0.9930 0.9757 0.9376 0.8705 0.7712 0.6437 0.5000 0.3563 0.2288 0.1295 0.0624 0.0243 0.0070 0.0013 0.0001 0.0000
7 1.0000 1.0000 0.9998 0.9988 0.9944 0.9818 0.9538 0.9023 0.8212 0.7095 0.5732 0.4256 0.2841 0.1654 0.0802 0.0300 0.0075 0.0009 0.0000
8 1.0000 1.0000 1.0000 0.9998 0.9990 0.9960 0.9874 0.9679 0.9302 0.8666 0.7721 0.6470 0.4995 0.3457 0.2060 0.0991 0.0342 0.0065 0.0003
9 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9975 0.9922 0.9797 0.9539 0.9071 0.8314 0.7217 0.5794 0.4157 0.2527 0.1180 0.0342 0.0031
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9987 0.9959 0.9888 0.9731 0.9421 0.8868 0.7975 0.6674 0.4983 0.3080 0.1339 0.0245
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9951 0.9874 0.9704 0.9363 0.8733 0.7664 0.6017 0.3787 0.1354
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9963 0.9903 0.9762 0.9450 0.8791 0.7458 0.4867

14 0 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8470 0.5846 0.3567 0.1979 0.1010 0.0475 0.0205 0.0081 0.0029 0.0009 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9699 0.8416 0.6479 0.4481 0.2811 0.1608 0.0839 0.0398 0.0170 0.0065 0.0022 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9958 0.9559 0.8535 0.6982 0.5213 0.3552 0.2205 0.1243 0.0632 0.0287 0.0114 0.0039 0.0011 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9996 0.9908 0.9533 0.8702 0.7415 0.5842 0.4227 0.2793 0.1672 0.0898 0.0426 0.0175 0.0060 0.0017 0.0003 0.0000 0.0000 0.0000 0.0000
5 1.0000 0.9985 0.9885 0.9561 0.8883 0.7805 0.6405 0.4859 0.3373 0.2120 0.1189 0.0583 0.0243 0.0083 0.0022 0.0004 0.0000 0.0000 0.0000
6 1.0000 0.9998 0.9978 0.9884 0.9617 0.9067 0.8164 0.6925 0.5461 0.3953 0.2586 0.1501 0.0753 0.0315 0.0103 0.0024 0.0003 0.0000 0.0000
7 1.0000 1.0000 0.9997 0.9976 0.9897 0.9685 0.9247 0.8499 0.7414 0.6047 0.4539 0.3075 0.1836 0.0933 0.0383 0.0116 0.0022 0.0002 0.0000
8 1.0000 1.0000 1.0000 0.9996 0.9978 0.9917 0.9757 0.9417 0.8811 0.7880 0.6627 0.5141 0.3595 0.2195 0.1117 0.0439 0.0115 0.0015 0.0000
9 1.0000 1.0000 1.0000 1.0000 0.9997 0.9983 0.9940 0.9825 0.9574 0.9102 0.8328 0.7207 0.5773 0.4158 0.2585 0.1298 0.0467 0.0092 0.0004
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9989 0.9961 0.9886 0.9713 0.9368 0.8757 0.7795 0.6448 0.4787 0.3018 0.1465 0.0441 0.0042
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9978 0.9935 0.9830 0.9602 0.9161 0.8392 0.7189 0.5519 0.3521 0.1584 0.0301
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991 0.9971 0.9919 0.9795 0.9525 0.8990 0.8021 0.6433 0.4154 0.1530
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9992 0.9976 0.9932 0.9822 0.9560 0.8972 0.7712 0.5123

253
P
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
15 0 0.4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8290 0.5490 0.3186 0.1671 0.0802 0.0353 0.0142 0.0052 0.0017 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9638 0.8159 0.6042 0.3980 0.2361 0.1268 0.0617 0.0271 0.0107 0.0037 0.0011 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9945 0.9444 0.8227 0.6482 0.4613 0.2969 0.1727 0.0905 0.0424 0.0176 0.0063 0.0019 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9994 0.9873 0.9383 0.8358 0.6865 0.5155 0.3519 0.2173 0.1204 0.0592 0.0255 0.0093 0.0028 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000
5 0.9999 0.9978 0.9832 0.9389 0.8516 0.7216 0.5643 0.4032 0.2608 0.1509 0.0769 0.0338 0.0124 0.0037 0.0008 0.0001 0.0000 0.0000 0.0000
6 1.0000 0.9997 0.9964 0.9819 0.9434 0.8689 0.7548 0.6098 0.4522 0.3036 0.1818 0.0950 0.0422 0.0152 0.0042 0.0008 0.0001 0.0000 0.0000
7 1.0000 1.0000 0.9994 0.9958 0.9827 0.9500 0.8868 0.7869 0.6535 0.5000 0.3465 0.2131 0.1132 0.0500 0.0173 0.0042 0.0006 0.0000 0.0000
8 1.0000 1.0000 0.9999 0.9992 0.9958 0.9848 0.9578 0.9050 0.8182 0.6964 0.5478 0.3902 0.2452 0.1311 0.0566 0.0181 0.0036 0.0003 0.0000
9 1.0000 1.0000 1.0000 0.9999 0.9992 0.9963 0.9876 0.9662 0.9231 0.8491 0.7392 0.5968 0.4357 0.2784 0.1484 0.0611 0.0168 0.0022 0.0001
10 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9972 0.9907 0.9745 0.9408 0.8796 0.7827 0.6481 0.4845 0.3135 0.1642 0.0617 0.0127 0.0006
11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9981 0.9937 0.9824 0.9576 0.9095 0.8273 0.7031 0.5387 0.3518 0.1773 0.0556 0.0055
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9963 0.9893 0.9729 0.9383 0.8732 0.7639 0.6020 0.3958 0.1841 0.0362
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9948 0.9858 0.9647 0.9198 0.8329 0.6814 0.4510 0.1710
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9984 0.9953 0.9866 0.9648 0.9126 0.7941 0.5367

16 0 0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.8108 0.5147 0.2839 0.1407 0.0635 0.0261 0.0098 0.0033 0.0010 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9571 0.7892 0.5614 0.3518 0.1971 0.0994 0.0451 0.0183 0.0066 0.0021 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9930 0.9316 0.7899 0.5981 0.4050 0.2459 0.1339 0.0651 0.0281 0.0106 0.0035 0.0009 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9991 0.9830 0.9209 0.7982 0.6302 0.4499 0.2892 0.1666 0.0853 0.0384 0.0149 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
5 0.9999 0.9967 0.9765 0.9183 0.8103 0.6598 0.4900 0.3288 0.1976 0.1051 0.0486 0.0191 0.0062 0.0016 0.0003 0.0000 0.0000 0.0000 0.0000
6 1.0000 0.9995 0.9944 0.9733 0.9204 0.8247 0.6881 0.5272 0.3660 0.2272 0.1241 0.0583 0.0229 0.0071 0.0016 0.0002 0.0000 0.0000 0.0000
7 1.0000 0.9999 0.9989 0.9930 0.9729 0.9256 0.8406 0.7161 0.5629 0.4018 0.2559 0.1423 0.0671 0.0257 0.0075 0.0015 0.0002 0.0000 0.0000
8 1.0000 1.0000 0.9998 0.9985 0.9925 0.9743 0.9329 0.8577 0.7441 0.5982 0.4371 0.2839 0.1594 0.0744 0.0271 0.0070 0.0011 0.0001 0.0000
9 1.0000 1.0000 1.0000 0.9998 0.9984 0.9929 0.9771 0.9417 0.8759 0.7728 0.6340 0.4728 0.3119 0.1753 0.0796 0.0267 0.0056 0.0005 0.0000
10 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9938 0.9809 0.9514 0.8949 0.8024 0.6712 0.5100 0.3402 0.1897 0.0817 0.0235 0.0033 0.0001
11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9851 0.9616 0.9147 0.8334 0.7108 0.5501 0.3698 0.2018 0.0791 0.0170 0.0009
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9991 0.9965 0.9894 0.9719 0.9349 0.8661 0.7541 0.5950 0.4019 0.2101 0.0684 0.0070
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9979 0.9934 0.9817 0.9549 0.9006 0.8029 0.6482 0.4386 0.2108 0.0429
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9967 0.9902 0.9739 0.9365 0.8593 0.7161 0.4853 0.1892

254
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9967 0.9900 0.9719 0.9257 0.8147 0.5599

P
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
17 0 0.4181 0.1668 0.0631 0.0225 0.0075 0.0023 0.0007 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.7922 0.4818 0.2525 0.1182 0.0501 0.0193 0.0067 0.0021 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9497 0.7618 0.5198 0.3096 0.1637 0.0774 0.0327 0.0123 0.0041 0.0012 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9912 0.9174 0.7556 0.5489 0.3530 0.2019 0.1028 0.0464 0.0184 0.0064 0.0019 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9988 0.9779 0.9013 0.7582 0.5739 0.3887 0.2348 0.1260 0.0596 0.0245 0.0086 0.0025 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
5 0.9999 0.9953 0.9681 0.8943 0.7653 0.5968 0.4197 0.2639 0.1471 0.0717 0.0301 0.0106 0.0030 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000
6 1.0000 0.9992 0.9917 0.9623 0.8929 0.7752 0.6188 0.4478 0.2902 0.1662 0.0826 0.0348 0.0120 0.0032 0.0006 0.0001 0.0000 0.0000 0.0000
7 1.0000 0.9999 0.9983 0.9891 0.9598 0.8954 0.7872 0.6405 0.4743 0.3145 0.1834 0.0919 0.0383 0.0127 0.0031 0.0005 0.0000 0.0000 0.0000
8 1.0000 1.0000 0.9997 0.9974 0.9876 0.9597 0.9006 0.8011 0.6626 0.5000 0.3374 0.1989 0.0994 0.0403 0.0124 0.0026 0.0003 0.0000 0.0000
9 1.0000 1.0000 1.0000 0.9995 0.9969 0.9873 0.9617 0.9081 0.8166 0.6855 0.5257 0.3595 0.2128 0.1046 0.0402 0.0109 0.0017 0.0001 0.0000
10 1.0000 1.0000 1.0000 0.9999 0.9994 0.9968 0.9880 0.9652 0.9174 0.8338 0.7098 0.5522 0.3812 0.2248 0.1071 0.0377 0.0083 0.0008 0.0000
11 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9970 0.9894 0.9699 0.9283 0.8529 0.7361 0.5803 0.4032 0.2347 0.1057 0.0319 0.0047 0.0001
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9975 0.9914 0.9755 0.9404 0.8740 0.7652 0.6113 0.4261 0.2418 0.0987 0.0221 0.0012
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9981 0.9936 0.9816 0.9536 0.8972 0.7981 0.6470 0.4511 0.2444 0.0826 0.0088
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9988 0.9959 0.9877 0.9673 0.9226 0.8363 0.6904 0.4802 0.2382 0.0503
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9979 0.9933 0.9807 0.9499 0.8818 0.7475 0.5182 0.2078
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9977 0.9925 0.9775 0.9369 0.8332 0.5819

18 0 0.3972 0.1501 0.0536 0.0180 0.0056 0.0016 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.7735 0.4503 0.2241 0.0991 0.0395 0.0142 0.0046 0.0013 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9419 0.7338 0.4797 0.2713 0.1353 0.0600 0.0236 0.0082 0.0025 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9891 0.9018 0.7202 0.5010 0.3057 0.1646 0.0783 0.0328 0.0120 0.0038 0.0010 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9985 0.9718 0.8794 0.7164 0.5187 0.3327 0.1886 0.0942 0.0411 0.0154 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
5 0.9998 0.9936 0.9581 0.8671 0.7175 0.5344 0.3550 0.2088 0.1077 0.0481 0.0183 0.0058 0.0014 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
6 1.0000 0.9988 0.9882 0.9487 0.8610 0.7217 0.5491 0.3743 0.2258 0.1189 0.0537 0.0203 0.0062 0.0014 0.0002 0.0000 0.0000 0.0000 0.0000
7 1.0000 0.9998 0.9973 0.9837 0.9431 0.8593 0.7283 0.5634 0.3915 0.2403 0.1280 0.0576 0.0212 0.0061 0.0012 0.0002 0.0000 0.0000 0.0000
8 1.0000 1.0000 0.9995 0.9957 0.9807 0.9404 0.8609 0.7368 0.5778 0.4073 0.2527 0.1347 0.0597 0.0210 0.0054 0.0009 0.0001 0.0000 0.0000
9 1.0000 1.0000 0.9999 0.9991 0.9946 0.9790 0.9403 0.8653 0.7473 0.5927 0.4222 0.2632 0.1391 0.0596 0.0193 0.0043 0.0005 0.0000 0.0000
10 1.0000 1.0000 1.0000 0.9998 0.9988 0.9939 0.9788 0.9424 0.8720 0.7597 0.6085 0.4366 0.2717 0.1407 0.0569 0.0163 0.0027 0.0002 0.0000
11 1.0000 1.0000 1.0000 1.0000 0.9998 0.9986 0.9938 0.9797 0.9463 0.8811 0.7742 0.6257 0.4509 0.2783 0.1390 0.0513 0.0118 0.0012 0.0000
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9986 0.9942 0.9817 0.9519 0.8923 0.7912 0.6450 0.4656 0.2825 0.1329 0.0419 0.0064 0.0002
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9846 0.9589 0.9058 0.8114 0.6673 0.4813 0.2836 0.1206 0.0282 0.0015
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9962 0.9880 0.9672 0.9217 0.8354 0.6943 0.4990 0.2798 0.0982 0.0109
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9975 0.9918 0.9764 0.9400 0.8647 0.7287 0.5203 0.2662 0.0581
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9987 0.9954 0.9858 0.9605 0.9009 0.7759 0.5497 0.2265
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9944 0.9820 0.9464 0.8499 0.6028

255
P
n x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
19 0 0.3774 0.1351 0.0456 0.0144 0.0042 0.0011 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.7547 0.4203 0.1985 0.0829 0.0310 0.0104 0.0031 0.0008 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9335 0.7054 0.4413 0.2369 0.1113 0.0462 0.0170 0.0055 0.0015 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9868 0.8850 0.6841 0.4551 0.2631 0.1332 0.0591 0.0230 0.0077 0.0022 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9980 0.9648 0.8556 0.6733 0.4654 0.2822 0.1500 0.0696 0.0280 0.0096 0.0028 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
5 0.9998 0.9914 0.9463 0.8369 0.6678 0.4739 0.2968 0.1629 0.0777 0.0318 0.0109 0.0031 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
6 1.0000 0.9983 0.9837 0.9324 0.8251 0.6655 0.4812 0.3081 0.1727 0.0835 0.0342 0.0116 0.0031 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000
7 1.0000 0.9997 0.9959 0.9767 0.9225 0.8180 0.6656 0.4878 0.3169 0.1796 0.0871 0.0352 0.0114 0.0028 0.0005 0.0000 0.0000 0.0000 0.0000
8 1.0000 1.0000 0.9992 0.9933 0.9713 0.9161 0.8145 0.6675 0.4940 0.3238 0.1841 0.0885 0.0347 0.0105 0.0023 0.0003 0.0000 0.0000 0.0000
9 1.0000 1.0000 0.9999 0.9984 0.9911 0.9674 0.9125 0.8139 0.6710 0.5000 0.3290 0.1861 0.0875 0.0326 0.0089 0.0016 0.0001 0.0000 0.0000
10 1.0000 1.0000 1.0000 0.9997 0.9977 0.9895 0.9653 0.9115 0.8159 0.6762 0.5060 0.3325 0.1855 0.0839 0.0287 0.0067 0.0008 0.0000 0.0000
11 1.0000 1.0000 1.0000 1.0000 0.9995 0.9972 0.9886 0.9648 0.9129 0.8204 0.6831 0.5122 0.3344 0.1820 0.0775 0.0233 0.0041 0.0003 0.0000
12 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9969 0.9884 0.9658 0.9165 0.8273 0.6919 0.5188 0.3345 0.1749 0.0676 0.0163 0.0017 0.0000
13 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9969 0.9891 0.9682 0.9223 0.8371 0.7032 0.5261 0.3322 0.1631 0.0537 0.0086 0.0002
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9972 0.9904 0.9720 0.9304 0.8500 0.7178 0.5346 0.3267 0.1444 0.0352 0.0020
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9978 0.9923 0.9770 0.9409 0.8668 0.7369 0.5449 0.3159 0.1150 0.0132
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9985 0.9945 0.9830 0.9538 0.8887 0.7631 0.5587 0.2946 0.0665
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9969 0.9896 0.9690 0.9171 0.8015 0.5797 0.2453
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9958 0.9856 0.9544 0.8649 0.6226

20 0 0.3585 0.1216 0.0388 0.0115 0.0032 0.0008 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.7358 0.3917 0.1756 0.0692 0.0243 0.0076 0.0021 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.9245 0.6769 0.4049 0.2061 0.0913 0.0355 0.0121 0.0036 0.0009 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.9841 0.8670 0.6477 0.4114 0.2252 0.1071 0.0444 0.0160 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.9974 0.9568 0.8298 0.6296 0.4148 0.2375 0.1182 0.0510 0.0189 0.0059 0.0015 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
5 0.9997 0.9887 0.9327 0.8042 0.6172 0.4164 0.2454 0.1256 0.0553 0.0207 0.0064 0.0016 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
6 1.0000 0.9976 0.9781 0.9133 0.7858 0.6080 0.4166 0.2500 0.1299 0.0577 0.0214 0.0065 0.0015 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
7 1.0000 0.9996 0.9941 0.9679 0.8982 0.7723 0.6010 0.4159 0.2520 0.1316 0.0580 0.0210 0.0060 0.0013 0.0002 0.0000 0.0000 0.0000 0.0000
8 1.0000 0.9999 0.9987 0.9900 0.9591 0.8867 0.7624 0.5956 0.4143 0.2517 0.1308 0.0565 0.0196 0.0051 0.0009 0.0001 0.0000 0.0000 0.0000
9 1.0000 1.0000 0.9998 0.9974 0.9861 0.9520 0.8782 0.7553 0.5914 0.4119 0.2493 0.1275 0.0532 0.0171 0.0039 0.0006 0.0000 0.0000 0.0000
10 1.0000 1.0000 1.0000 0.9994 0.9961 0.9829 0.9468 0.8725 0.7507 0.5881 0.4086 0.2447 0.1218 0.0480 0.0139 0.0026 0.0002 0.0000 0.0000
11 1.0000 1.0000 1.0000 0.9999 0.9991 0.9949 0.9804 0.9435 0.8692 0.7483 0.5857 0.4044 0.2376 0.1133 0.0409 0.0100 0.0013 0.0001 0.0000
12 1.0000 1.0000 1.0000 1.0000 0.9998 0.9987 0.9940 0.9790 0.9420 0.8684 0.7480 0.5841 0.3990 0.2277 0.1018 0.0321 0.0059 0.0004 0.0000
13 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9935 0.9786 0.9423 0.8701 0.7500 0.5834 0.3920 0.2142 0.0867 0.0219 0.0024 0.0000
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9936 0.9793 0.9447 0.8744 0.7546 0.5836 0.3828 0.1958 0.0673 0.0113 0.0003
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9941 0.9811 0.9490 0.8818 0.7625 0.5852 0.3704 0.1702 0.0432 0.0026
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9840 0.9556 0.8929 0.7748 0.5886 0.3523 0.1330 0.0159
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9991 0.9964 0.9879 0.9645 0.9087 0.7939 0.5951 0.3231 0.0755
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9979 0.9924 0.9757 0.9308 0.8244 0.6083 0.2642
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9968 0.9885 0.9612 0.8784 0.6415

256
257
x
e −λ λ k
Tabla II - Distribución de Poisson Acumulada: F(x; λ ) = ∑
k =0 k!

x 0 1 2 3 4 5 6 7 8 9
λ
0.02 0.980 1.000
0.04 0.961 0.999 1.000
0.06 0.942 0.998 1.000
0.08 0.923 0.997 1.000
0.10 0.905 0.995 1.000
0.15 0.861 0.990 0.999 1.000
0.20 0.819 0.982 0.999 1.000
0.25 0.779 0.974 0.998 1.000
0.30 0.741 0.963 0.996 1.000
0.35 0.705 0.951 0.994 1.000
0.40 0.670 0.938 0.992 0.999 1.000
0.45 0.638 0.925 0.989 0.999 1.000
0.50 0.607 0.910 0.986 0.998 1.000
0.55 0.577 0.894 0.982 0.998 1.000
0.60 0.549 0.878 0.977 0.997 1.000
0.65 0.522 0.861 0.972 0.996 0.999 1.000
0.70 0.497 0.844 0.966 0.994 0.999 1.000
0.75 0.472 0.827 0.959 0.993 0.999 1.000
0.80 0.449 0.809 0.953 0.991 0.999 1.000
0.85 0.427 0.791 0.945 0.989 0.998 1.000
0.90 0.407 0.772 0.937 0.987 0.998 1.000
0.95 0.387 0.754 0.929 0.984 0.997 1.000
1.00 0.368 0.736 0.920 0.981 0.996 0.999 1.000
1.10 0.333 0.699 0.900 0.974 0.995 0.999 1.000
1.20 0.301 0.663 0.879 0.966 0.992 0.998 1.000
1.30 0.273 0.627 0.857 0.957 0.989 0.998 1.000
1.40 0.247 0.592 0.833 0.946 0.986 0.997 0.999 1.000
1.50 0.223 0.558 0.809 0.934 0.981 0.996 0.999 1.000
1.60 0.202 0.525 0.783 0.921 0.976 0.994 0.999 1.000
1.70 0.183 0.493 0.757 0.907 0.970 0.992 0.998 1.000
1.80 0.165 0.463 0.731 0.891 0.964 0.990 0.997 0.999 1.000
1.90 0.150 0.434 0.704 0.875 0.956 0.987 0.997 0.999 1.000
2.00 0.135 0.406 0.677 0.857 0.947 0.983 0.995 0.999 1.000

258
x 0 1 2 3 4 5 6 7 8 9
λ
2.2 0.111 0.355 0.623 0.819 0.928 0.975 0.993 0.998 1.000 1.000
2.4 0.091 0.308 0.570 0.779 0.904 0.964 0.988 0.997 0.999 1.000
2.6 0.074 0.267 0.518 0.736 0.877 0.951 0.983 0.995 0.999 1.000
2.8 0.061 0.231 0.469 0.692 0.848 0.935 0.976 0.992 0.998 0.999
3.0 0.050 0.199 0.423 0.647 0.815 0.916 0.966 0.988 0.996 0.999
3.2 0.041 0.171 0.380 0.603 0.781 0.895 0.955 0.983 0.994 0.998
3.4 0.033 0.147 0.340 0.558 0.744 0.871 0.942 0.977 0.992 0.997
3.6 0.027 0.126 0.303 0.515 0.706 0.844 0.927 0.969 0.988 0.996
3.8 0.022 0.107 0.269 0.473 0.668 0.816 0.909 0.960 0.984 0.994
4.0 0.018 0.092 0.238 0.433 0.629 0.785 0.889 0.949 0.979 0.992
4.2 0.015 0.078 0.210 0.395 0.590 0.753 0.867 0.936 0.972 0.989
4.4 0.012 0.066 0.185 0.359 0.551 0.720 0.844 0.921 0.964 0.985
4.6 0.010 0.056 0.163 0.326 0.513 0.686 0.818 0.905 0.955 0.980
4.8 0.008 0.048 0.143 0.294 0.476 0.651 0.791 0.887 0.944 0.975
5.0 0.007 0.040 0.125 0.265 0.440 0.616 0.762 0.867 0.932 0.968
5.2 0.006 0.034 0.109 0.238 0.406 0.581 0.732 0.845 0.918 0.960
5.4 0.005 0.029 0.095 0.213 0.373 0.546 0.702 0.822 0.903 0.951
5.6 0.004 0.024 0.082 0.191 0.342 0.512 0.670 0.797 0.886 0.941
5.8 0.003 0.021 0.072 0.170 0.313 0.478 0.638 0.771 0.867 0.929
6.0 0.002 0.017 0.062 0.151 0.285 0.446 0.606 0.744 0.847 0.916
10 11 12 13 14 15 16

2.8 1.000
3.0 1.000
3.2 1.000
3.4 0.999 1.000
3.6 0.999 1.000
3.8 0.998 0.999 1.000
4.0 0.997 0.999 1.000
4.2 0.996 0.999 1.000
4.4 0.994 0.998 0.999 1.000
4.6 0.992 0.997 0.999 1.000
4.8 0.990 0.996 0.999 1.000
5.0 0.986 0.995 0.998 0.999 1.000
5.2 0.982 0.993 0.997 0.999 1.000
5.4 0.977 0.990 0.996 0.999 1.000
5.6 0.972 0.988 0.995 0.998 0.999 1.000
5.8 0.965 0.984 0.993 0.997 0.999 1.000
6.0 0.957 0.980 0.991 0.996 0.999 0.999 1.000

259
x 0 1 2 3 4 5 6 7 8 9
λ
6.2 0.002 0.015 0.054 0.134 0.259 0.414 0.574 0.716 0.826 0.902
6.4 0.002 0.012 0.046 0.119 0.235 0.384 0.542 0.687 0.803 0.886
6.6 0.001 0.010 0.040 0.105 0.213 0.355 0.511 0.658 0.780 0.869
6.8 0.001 0.009 0.034 0.093 0.192 0.327 0.480 0.628 0.755 0.850
7.0 0.001 0.007 0.030 0.082 0.173 0.301 0.450 0.599 0.729 0.830
7.2 0.001 0.006 0.025 0.072 0.156 0.276 0.420 0.569 0.703 0.810
7.4 0.001 0.005 0.022 0.063 0.140 0.253 0.392 0.539 0.676 0.788
7.6 0.001 0.004 0.019 0.055 0.125 0.231 0.365 0.510 0.648 0.765
7.8 0.000 0.004 0.016 0.048 0.112 0.210 0.338 0.481 0.620 0.741
8.0 0.000 0.003 0.014 0.042 0.100 0.191 0.313 0.453 0.593 0.717
8.5 0.000 0.002 0.009 0.030 0.074 0.150 0.256 0.386 0.523 0.653
9.0 0.000 0.001 0.006 0.021 0.055 0.116 0.207 0.324 0.456 0.587
9.5 0.000 0.001 0.004 0.015 0.040 0.089 0.165 0.269 0.392 0.522
10.0 0.000 0.000 0.003 0.010 0.029 0.067 0.130 0.220 0.333 0.458
10 11 12 13 14 15 16 17 18 19

6.2 0.949 0.975 0.989 0.995 0.998 0.999 1.000


6.4 0.939 0.969 0.986 0.994 0.997 0.999 1.000
6.6 0.927 0.963 0.982 0.992 0.997 0.999 0.999 1.000
6.8 0.915 0.955 0.978 0.990 0.996 0.998 0.999 1.000
7.0 0.901 0.947 0.973 0.987 0.994 0.998 0.999 1.000
7.2 0.887 0.937 0.967 0.984 0.993 0.997 0.999 1.000
7.4 0.871 0.926 0.961 0.980 0.991 0.996 0.998 0.999 1.000
7.6 0.854 0.915 0.954 0.976 0.989 0.995 0.998 0.999 1.000
7.8 0.835 0.902 0.945 0.971 0.986 0.993 0.997 0.999 1.000
8.0 0.816 0.888 0.936 0.966 0.983 0.992 0.996 0.998 0.999 1.000
8.5 0.763 0.849 0.909 0.949 0.973 0.986 0.993 0.997 0.999 0.999
9.0 0.706 0.803 0.876 0.926 0.959 0.978 0.989 0.995 0.998 0.999
9.5 0.645 0.752 0.836 0.898 0.940 0.967 0.982 0.991 0.996 0.998
10.0 0.583 0.697 0.792 0.864 0.917 0.951 0.973 0.986 0.993 0.997
20 21 22

8.5 1.000
9.0 1.000
9.5 0.999 1.000
10.0 0.998 0.999 1.000

260
x 0 1 2 3 4 5 6 7 8 9
λ
10.5 0.000 0.000 0.002 0.007 0.021 0.050 0.102 0.179 0.279 0.397
11.0 0.000 0.000 0.001 0.005 0.015 0.038 0.079 0.143 0.232 0.341
11.5 0.000 0.000 0.001 0.003 0.011 0.028 0.060 0.114 0.191 0.289
12.0 0.000 0.000 0.001 0.002 0.008 0.020 0.046 0.090 0.155 0.242
12.5 0.000 0.000 0.000 0.002 0.005 0.015 0.035 0.070 0.125 0.201
13.0 0.000 0.000 0.000 0.001 0.004 0.011 0.026 0.054 0.100 0.166
13.5 0.000 0.000 0.000 0.001 0.003 0.008 0.019 0.041 0.079 0.135
14.0 0.000 0.000 0.000 0.000 0.002 0.006 0.014 0.032 0.062 0.109
14.5 0.000 0.000 0.000 0.000 0.001 0.004 0.010 0.024 0.048 0.088
15.0 0.000 0.000 0.000 0.000 0.001 0.003 0.008 0.018 0.037 0.070
10 11 12 13 14 15 16 17 18 19

10.5 0.521 0.639 0.742 0.825 0.888 0.932 0.960 0.978 0.988 0.994
11.0 0.460 0.579 0.689 0.781 0.854 0.907 0.944 0.968 0.982 0.991
11.5 0.402 0.520 0.633 0.733 0.815 0.878 0.924 0.954 0.974 0.986
12.0 0.347 0.462 0.576 0.682 0.772 0.844 0.899 0.937 0.963 0.979
12.5 0.297 0.406 0.519 0.628 0.725 0.806 0.869 0.916 0.948 0.969
13.0 0.252 0.353 0.463 0.573 0.675 0.764 0.835 0.890 0.930 0.957
13.5 0.211 0.304 0.409 0.518 0.623 0.718 0.798 0.861 0.908 0.942
14.0 0.176 0.260 0.358 0.464 0.570 0.669 0.756 0.827 0.883 0.923
14.5 0.145 0.220 0.311 0.413 0.518 0.619 0.711 0.790 0.853 0.901
15.0 0.118 0.185 0.268 0.363 0.466 0.568 0.664 0.749 0.819 0.875
20 21 22 23 24 25 26 27 28 29

10.5 0.997 0.999 0.999 1.000


11.0 0.995 0.998 0.999 1.000
11.5 0.992 0.996 0.998 0.999 1.000
12.0 0.988 0.994 0.997 0.999 0.999 1.000
12.5 0.983 0.991 0.995 0.998 0.999 0.999 1.000
13.0 0.975 0.986 0.992 0.996 0.998 0.999 1.000
13.5 0.965 0.980 0.989 0.994 0.997 0.998 0.999 1.000
14.0 0.952 0.971 0.983 0.991 0.995 0.997 0.999 0.999 1.000
14.5 0.936 0.960 0.976 0.986 0.992 0.996 0.998 0.999 0.999 1.000
15.0 0.917 0.947 0.967 0.981 0.989 0.994 0.997 0.998 0.999 1.000

261
x 4 5 6 7 8 9 10 11 12 13
λ
16 0.000 0.001 0.004 0.010 0.022 0.043 0.077 0.127 0.193 0.275
17 0.000 0.001 0.002 0.005 0.013 0.026 0.049 0.085 0.135 0.201
18 0.000 0.000 0.001 0.003 0.007 0.015 0.030 0.055 0.092 0.143
19 0.000 0.000 0.001 0.002 0.004 0.009 0.018 0.035 0.061 0.098
20 0.000 0.000 0.000 0.001 0.002 0.005 0.011 0.021 0.039 0.066
21 0.000 0.000 0.000 0.000 0.001 0.003 0.006 0.013 0.025 0.043
22 0.000 0.000 0.000 0.000 0.001 0.002 0.004 0.008 0.015 0.028
23 0.000 0.000 0.000 0.000 0.000 0.001 0.002 0.004 0.009 0.017
24 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.003 0.005 0.011
25 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.001 0.003 0.006
14 15 16 17 18 19 20 21 22 23
16 0.368 0.467 0.566 0.659 0.742 0.812 0.868 0.911 0.942 0.963
17 0.281 0.371 0.468 0.564 0.655 0.736 0.805 0.861 0.905 0.937
18 0.208 0.287 0.375 0.469 0.562 0.651 0.731 0.799 0.855 0.899
19 0.150 0.215 0.292 0.378 0.469 0.561 0.647 0.725 0.793 0.849
20 0.105 0.157 0.221 0.297 0.381 0.470 0.559 0.644 0.721 0.787
21 0.072 0.111 0.163 0.227 0.302 0.384 0.471 0.558 0.640 0.716
22 0.048 0.077 0.117 0.169 0.232 0.306 0.387 0.472 0.556 0.637
23 0.031 0.052 0.082 0.123 0.175 0.238 0.310 0.389 0.472 0.555
24 0.020 0.034 0.056 0.087 0.128 0.180 0.243 0.314 0.392 0.473
25 0.012 0.022 0.038 0.060 0.092 0.134 0.185 0.247 0.318 0.394
24 25 26 27 28 29 30 31 32 33
16 0.978 0.987 0.993 0.996 0.998 0.999 0.999 1.000
17 0.959 0.975 0.985 0.991 0.995 0.997 0.999 0.999 1.000
18 0.932 0.955 0.972 0.983 0.990 0.994 0.997 0.998 0.999 1.000
19 0.893 0.927 0.951 0.969 0.980 0.988 0.993 0.996 0.998 0.999
20 0.843 0.888 0.922 0.948 0.966 0.978 0.987 0.992 0.995 0.997
21 0.782 0.838 0.883 0.917 0.944 0.963 0.976 0.985 0.991 0.994
22 0.712 0.777 0.832 0.877 0.913 0.940 0.959 0.973 0.983 0.989
23 0.635 0.708 0.772 0.827 0.873 0.908 0.936 0.956 0.971 0.981
24 0.554 0.632 0.704 0.768 0.823 0.868 0.904 0.932 0.953 0.969
25 0.473 0.553 0.629 0.700 0.763 0.818 0.863 0.900 0.929 0.950
34 35 36 37 38 39 40 41 42 43
19 0.999 1.000
20 0.999 0.999 1.000
21 0.997 0.998 0.999 0.999 1.000
22 0.994 0.996 0.998 0.999 0.999 1.000
23 0.988 0.993 0.996 0.997 0.999 0.999 1.000
24 0.979 0.987 0.992 0.995 0.997 0.998 0.999 0.999 1.000
25 0.966 0.978 0.985 0.991 0.994 0.997 0.998 0.999 0.999 1.000

262
Tabla III - Distribución Normal Estándar Acumulada

σz =1

µz = 0 z z
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4.0 0.99997 0.99997 0.99997 0.99997 0.99997 0.99997 0.99998 0.99998 0.99998 0.99998
5.0 1.00000

263
Tabla IV - Distribución Normal Estándar de Cola Superior

σz =1

µz = 0 z z
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.47210 0.46812 0.46414
0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038 0.43644 0.43251 0.42858 0.42465
0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636 0.32276 0.31918 0.31561 0.31207
0.5 0.30854 0.30503 0.30153 0.29806 0.29460 0.29116 0.28774 0.28434 0.28096 0.27760
0.6 0.27425 0.27093 0.26763 0.26435 0.26109 0.25785 0.25463 0.25143 0.24825 0.24510
0.7 0.24196 0.23885 0.23576 0.23270 0.22965 0.22663 0.22363 0.22065 0.21770 0.21476
0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
1.1 0.13567 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702
1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09853
1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08692 0.08534 0.08379 0.08226
1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07215 0.07078 0.06944 0.06811
1.5 0.06681 0.06552 0.06426 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551
1.7 0.04457 0.04363 0.04272 0.04182 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673
1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330
2.0 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.01970 0.01923 0.01876 0.01831
2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.00100
3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
5.0 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

264
Tabla V - Números Aleatorios

62800 8572 7650 47260 48741 5368 44176 3727 25838 76198
70411 27677 40988 66361 73560 53307 46403 62147 66723 11403
48019 17310 22418 87544 43631 19551 32725 6405 29029 14264
93458 72337 47386 99482 11525 3472 19514 8384 56305 96042
32125 21303 42338 18959 69709 35892 16256 44962 96712 29689
19442 58566 97417 53529 69827 96883 11732 1344 17866 78664
34040 28322 69934 47103 42616 54105 83123 79049 59173 63859
16298 81935 2307 82016 76514 62580 19560 77265 38031 25189
98847 97682 59022 74556 17862 46360 24209 7102 73729 14610
39807 63457 30519 48596 80138 54495 17839 3336 86215 34308
80916 1889 73750 21284 13354 75436 81626 64841 24271 88776
50488 66470 18449 12645 67890 73380 89701 92591 52468 13861
21968 67910 66282 79595 25041 46457 79083 95017 84610 75599
81666 59781 34295 34949 57656 58194 44792 19122 13866 95404
83169 20049 17491 3150 56282 71387 10374 4713 2698 17902
40259 1836 48980 50681 63939 65850 36559 65345 73935 38566
79586 39771 16480 70637 51621 94773 86762 15322 2684 78105
90160 84607 47127 54609 34281 93529 72143 41140 55311 29759
84511 591 29606 84684 3390 14074 41962 33471 42782 80865
93354 50907 76761 90997 7055 4118 60561 88681 56353 65529
84738 33621 12955 56678 59917 64128 17835 77722 31762 56772
74206 1329 75405 69039 50134 90499 15096 80281 64773 52543
41072 89757 20877 49842 19806 38741 94350 33459 19506 85843
88588 46360 22243 71751 82899 76063 32333 61241 72458 33005
61297 20492 74025 20501 61268 36053 1890 86124 43853 1444
6832 15442 76519 13667 43249 65257 10215 40209 9306 16856
66176 38161 4655 42685 28347 13293 70052 99530 3437 78235
71885 353 91494 81099 96039 21051 67288 55986 59067 21954
27027 55973 32942 47542 28514 56249 38020 18764 99434 61713
94877 11500 64370 94529 92379 78864 44531 60467 70753 83031
65718 36169 38701 98812 49967 49052 58748 81829 67391 68573
79879 10685 58274 27245 98184 88102 73113 63720 14122 14782
94041 93625 11574 90652 13082 95710 91751 5842 99904 81562
41152 77675 70300 41686 19715 39707 82190 6825 50056 23495
66524 56997 92803 35040 45261 24660 10091 26381 6938 56297
16105 84615 24078 94841 54801 22758 28678 70334 70909 14391
59176 87517 29068 98281 41466 58425 11477 39005 93279 18612
9329 45955 42127 53901 79565 27969 4649 81891 73034 90703
17221 47288 33512 46586 41929 3068 50356 65550 92481 76651
9608 80624 26055 4782 80662 6148 2679 30449 56911 44973
2365 46435 62430 50804 69531 89654 14980 38921 63334 27672
84334 67175 46033 13298 23326 970 48400 58983 97518 49118

265
6916 46777 22145 6316 53599 14508 6072 50624 2926 61380

Tabla VI - Distribución t de Student

0 tα ,ν t
ν\α 0.4 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 0.3249 1.0000 3.0777 6.3137 12.7062 31.8210 63.6559 127.3211 318.2888 636.5776
2 0.2887 0.8165 1.8856 2.9200 4.3027 6.9645 9.9250 14.0892 22.3285 31.5998
3 0.2767 0.7649 1.6377 2.3534 3.1824 4.5407 5.8408 7.4532 10.2143 12.9244
4 0.2707 0.7407 1.5332 2.1318 2.7765 3.7469 4.6041 5.5975 7.1729 8.6101
5 0.2672 0.7267 1.4759 2.0150 2.5706 3.3649 4.0321 4.7733 5.8935 6.8685
6 0.2648 0.7176 1.4398 1.9432 2.4469 3.1427 3.7074 4.3168 5.2075 5.9587
7 0.2632 0.7111 1.4149 1.8946 2.3646 2.9979 3.4995 4.0294 4.7853 5.4081
8 0.2619 0.7064 1.3968 1.8595 2.3060 2.8965 3.3554 3.8325 4.5008 5.0414
9 0.2610 0.7027 1.3830 1.8331 2.2622 2.8214 3.2498 3.6896 4.2969 4.7809
10 0.2602 0.6998 1.3722 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.5868
11 0.2596 0.6974 1.3634 1.7959 2.2010 2.7181 3.1058 3.4966 4.0248 4.4369
12 0.2590 0.6955 1.3562 1.7823 2.1788 2.6810 3.0545 3.4284 3.9296 4.3178
13 0.2586 0.6938 1.3502 1.7709 2.1604 2.6503 3.0123 3.3725 3.8520 4.2209
14 0.2582 0.6924 1.3450 1.7613 2.1448 2.6245 2.9768 3.3257 3.7874 4.1403
15 0.2579 0.6912 1.3406 1.7531 2.1315 2.6025 2.9467 3.2860 3.7329 4.0728
16 0.2576 0.6901 1.3368 1.7459 2.1199 2.5835 2.9208 3.2520 3.6861 4.0149
17 0.2573 0.6892 1.3334 1.7396 2.1098 2.5669 2.8982 3.2224 3.6458 3.9651
18 0.2571 0.6884 1.3304 1.7341 2.1009 2.5524 2.8784 3.1966 3.6105 3.9217
19 0.2569 0.6876 1.3277 1.7291 2.0930 2.5395 2.8609 3.1737 3.5793 3.8833
20 0.2567 0.6870 1.3253 1.7247 2.0860 2.5280 2.8453 3.1534 3.5518 3.8496
21 0.2566 0.6864 1.3232 1.7207 2.0796 2.5176 2.8314 3.1352 3.5271 3.8193
22 0.2564 0.6858 1.3212 1.7171 2.0739 2.5083 2.8188 3.1188 3.5050 3.7922
23 0.2563 0.6853 1.3195 1.7139 2.0687 2.4999 2.8073 3.1040 3.4850 3.7676
24 0.2562 0.6848 1.3178 1.7109 2.0639 2.4922 2.7970 3.0905 3.4668 3.7454
25 0.2561 0.6844 1.3163 1.7081 2.0595 2.4851 2.7874 3.0782 3.4502 3.7251
26 0.2560 0.6840 1.3150 1.7056 2.0555 2.4786 2.7787 3.0669 3.4350 3.7067
27 0.2559 0.6837 1.3137 1.7033 2.0518 2.4727 2.7707 3.0565 3.4210 3.6895
28 0.2558 0.6834 1.3125 1.7011 2.0484 2.4671 2.7633 3.0470 3.4082 3.6739
29 0.2557 0.6830 1.3114 1.6991 2.0452 2.4620 2.7564 3.0380 3.3963 3.6595
30 0.2556 0.6828 1.3104 1.6973 2.0423 2.4573 2.7500 3.0298 3.3852 3.6460
31 0.2555 0.6825 1.3095 1.6955 2.0395 2.4528 2.7440 3.0221 3.3749 3.6335
32 0.2555 0.6822 1.3086 1.6939 2.0369 2.4487 2.7385 3.0149 3.3653 3.6218
33 0.2554 0.6820 1.3077 1.6924 2.0345 2.4448 2.7333 3.0082 3.3563 3.6109
34 0.2553 0.6818 1.3070 1.6909 2.0322 2.4411 2.7284 3.0020 3.3480 3.6007
35 0.2553 0.6816 1.3062 1.6896 2.0301 2.4377 2.7238 2.9961 3.3400 3.5911
36 0.2552 0.6814 1.3055 1.6883 2.0281 2.4345 2.7195 2.9905 3.3326 3.5821
37 0.2552 0.6812 1.3049 1.6871 2.0262 2.4314 2.7154 2.9853 3.3256 3.5737
38 0.2551 0.6810 1.3042 1.6860 2.0244 2.4286 2.7116 2.9803 3.3190 3.5657
39 0.2551 0.6808 1.3036 1.6849 2.0227 2.4258 2.7079 2.9756 3.3127 3.5581
40 0.2550 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 2.9712 3.3069 3.5510
50 0.2547 0.6794 1.2987 1.6759 2.0086 2.4033 2.6778 2.9370 3.2614 3.4960
60 0.2545 0.6786 1.2958 1.6706 2.0003 2.3901 2.6603 2.9146 3.2317 3.4602
70 0.2543 0.6780 1.2938 1.6669 1.9944 2.3808 2.6479 2.8987 3.2108 3.4350
80 0.2542 0.6776 1.2922 1.6641 1.9901 2.3739 2.6387 2.8870 3.1952 3.4164
90 0.2541 0.6772 1.2910 1.6620 1.9867 2.3685 2.6316 2.8779 3.1832 3.4019
100 0.2540 0.6770 1.2901 1.6602 1.9840 2.3642 2.6259 2.8707 3.1738 3.3905
110 0.2540 0.6767 1.2893 1.6588 1.9818 2.3607 2.6213 2.8648 3.1660 3.3811
120 0.2539 0.6765 1.2886 1.6576 1.9799 2.3578 2.6174 2.8599 3.1595 3.3734
∞ 0.2530 0.6740 1.2820 1.6450 1.9600 2.3260 2.5760 2.8070 3.0900 3.2910

266
Tabla VII - Distribución Chi-cuadrada

1−α
α

0 χ2
χ α2 ,ν
ν \α 0.995 0.99 0.975 0.95 0.50 0.05 0.025 0.01 0.005
1 0.0000 0.0002 0.0010 0.0039 0.4549 3.8415 5.0239 6.6349 7.8794
2 0.0100 0.0201 0.0506 0.1026 1.3863 5.9915 7.3778 9.2104 10.5965
3 0.0717 0.1148 0.2158 0.3518 2.3660 7.8147 9.3484 11.3449 12.8381
4 0.2070 0.2971 0.4844 0.7107 3.3567 9.4877 11.1433 13.2767 14.8602
5 0.4118 0.5543 0.8312 1.1455 4.3515 11.0705 12.8325 15.0863 16.7496
6 0.6757 0.8721 1.2373 1.6354 5.3481 12.5916 14.4494 16.8119 18.5475
7 0.9893 1.2390 1.6899 2.1673 6.3458 14.0671 16.0128 18.4753 20.2777
8 1.3444 1.6465 2.1797 2.7326 7.3441 15.5073 17.5345 20.0902 21.9549
9 1.7349 2.0879 2.7004 3.3251 8.3428 16.9190 19.0228 21.6660 23.5893
10 2.1558 2.5582 3.2470 3.9403 9.3418 18.3070 20.4832 23.2093 25.1881
11 2.6032 3.0535 3.8157 4.5748 10.3410 19.6752 21.9200 24.7250 26.7569
12 3.0738 3.5706 4.4038 5.2260 11.3403 21.0261 23.3367 26.2170 28.2997
13 3.5650 4.1069 5.0087 5.8919 12.3398 22.3620 24.7356 27.6882 29.8193
14 4.0747 4.6604 5.6287 6.5706 13.3393 23.6848 26.1189 29.1412 31.3194
15 4.6009 5.2294 6.2621 7.2609 14.3389 24.9958 27.4884 30.5780 32.8015
16 5.1422 5.8122 6.9077 7.9616 15.3385 26.2962 28.8453 31.9999 34.2671
17 5.6973 6.4077 7.5642 8.6718 16.3382 27.5871 30.1910 33.4087 35.7184
18 6.2648 7.0149 8.2307 9.3904 17.3379 28.8693 31.5264 34.8052 37.1564
19 6.8439 7.6327 8.9065 10.1170 18.3376 30.1435 32.8523 36.1908 38.5821
20 7.4338 8.2604 9.5908 10.8508 19.3374 31.4104 34.1696 37.5663 39.9969
21 8.0336 8.8972 10.2829 11.5913 20.3372 32.6706 35.4789 38.9322 41.4009
22 8.6427 9.5425 10.9823 12.3380 21.3370 33.9245 36.7807 40.2894 42.7957
23 9.2604 10.1957 11.6885 13.0905 22.3369 35.1725 38.0756 41.6383 44.1814
24 9.8862 10.8563 12.4011 13.8484 23.3367 36.4150 39.3641 42.9798 45.5584
25 10.5196 11.5240 13.1197 14.6114 24.3366 37.6525 40.6465 44.3140 46.9280
26 11.1602 12.1982 13.8439 15.3792 25.3365 38.8851 41.9231 45.6416 48.2898
27 11.8077 12.8785 14.5734 16.1514 26.3363 40.1133 43.1945 46.9628 49.6450
28 12.4613 13.5647 15.3079 16.9279 27.3362 41.3372 44.4608 48.2782 50.9936
29 13.1211 14.2564 16.0471 17.7084 28.3361 42.5569 45.7223 49.5878 52.3355
30 13.7867 14.9535 16.7908 18.4927 29.3360 43.7730 46.9792 50.8922 53.6719
31 14.4577 15.6555 17.5387 19.2806 30.3359 44.9853 48.2319 52.1914 55.0025
32 15.1340 16.3622 18.2908 20.0719 31.3359 46.1942 49.4804 53.4857 56.3280
33 15.8152 17.0735 19.0467 20.8665 32.3358 47.3999 50.7251 54.7754 57.6483
34 16.5013 17.7891 19.8062 21.6643 33.3357 48.6024 51.9660 56.0609 58.9637
35 17.1917 18.5089 20.5694 22.4650 34.3356 49.8018 53.2033 57.3420 60.2746
36 17.8868 19.2326 21.3359 23.2686 35.3356 50.9985 54.4373 58.6192 61.5811
37 18.5859 19.9603 22.1056 24.0749 36.3355 52.1923 55.6680 59.8926 62.8832
38 19.2888 20.6914 22.8785 24.8839 37.3354 53.3835 56.8955 61.1620 64.1812
39 19.9958 21.4261 23.6543 25.6954 38.3354 54.5722 58.1201 62.4281 65.4753
40 20.7066 22.1642 24.4331 26.5093 39.3353 55.7585 59.3417 63.6908 66.7660
50 27.9908 29.7067 32.3574 34.7642 49.3349 67.5048 71.4202 76.1538 79.4898
60 35.5344 37.4848 40.4817 43.1880 59.3347 79.0820 83.2977 88.3794 91.9518
70 43.2753 45.4417 48.7575 51.7393 69.3345 90.5313 95.0231 100.4251 104.2148
80 51.1719 53.5400 57.1532 60.3915 79.3343 101.8795 106.6285 112.3288 116.3209
90 59.1963 61.7540 65.6466 69.1260 89.3342 113.1452 118.1359 124.1162 128.2987
100 67.3275 70.0650 74.2219 77.9294 99.3341 124.3421 129.5613 135.8069 140.1697

267
Tabla VIII - Distribución F de Fisher ( F 0.25,ν1 ,ν 2 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
1 5.83 7.50 8.20 8.58 8.82 8.98 9.10 9.19 9.26 9.32 9.37 9.41 9.44 9.47 9.49 9.52 9.53 9.55 9.57 9.58 9.59 9.61 9.62 9.63 9.63 9.64 9.65 9.66 9.66 9.67 9.71 9.76 9.80
2 2.57 3.00 3.15 3.23 3.28 3.31 3.34 3.35 3.37 3.38 3.39 3.39 3.40 3.41 3.41 3.41 3.42 3.42 3.42 3.43 3.43 3.43 3.43 3.43 3.44 3.44 3.44 3.44 3.44 3.44 3.45 3.46 3.47
3 2.02 2.28 2.36 2.39 2.41 2.42 2.43 2.44 2.44 2.44 2.45 2.45 2.45 2.45 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.47 2.47 2.47 2.47
4 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08
5 1.69 1.85 1.88 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.87 1.87
6 1.62 1.76 1.78 1.79 1.79 1.78 1.78 1.78 1.77 1.77 1.77 1.77 1.77 1.76 1.76 1.76 1.76 1.76 1.76 1.76 1.76 1.76 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.74 1.74
7 1.57 1.70 1.72 1.72 1.71 1.71 1.70 1.70 1.69 1.69 1.69 1.68 1.68 1.68 1.68 1.68 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.66 1.66 1.66 1.66 1.65 1.65
8 1.54 1.66 1.67 1.66 1.66 1.65 1.64 1.64 1.63 1.63 1.63 1.62 1.62 1.62 1.62 1.62 1.61 1.61 1.61 1.61 1.61 1.61 1.61 1.60 1.60 1.60 1.60 1.60 1.60 1.60 1.59 1.59 1.58
9 1.51 1.62 1.63 1.63 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.58 1.58 1.57 1.57 1.57 1.57 1.56 1.56 1.56 1.56 1.56 1.56 1.56 1.55 1.55 1.55 1.55 1.55 1.55 1.54 1.54 1.53
10 1.49 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.55 1.54 1.54 1.54 1.53 1.53 1.53 1.53 1.53 1.52 1.52 1.52 1.52 1.52 1.52 1.52 1.51 1.51 1.51 1.51 1.51 1.50 1.49
11 1.47 1.58 1.58 1.57 1.56 1.55 1.54 1.53 1.53 1.52 1.52 1.51 1.51 1.51 1.50 1.50 1.50 1.50 1.49 1.49 1.49 1.49 1.49 1.49 1.49 1.48 1.48 1.48 1.48 1.48 1.47 1.47 1.46
12 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51 1.50 1.49 1.49 1.49 1.48 1.48 1.48 1.47 1.47 1.47 1.47 1.47 1.46 1.46 1.46 1.46 1.46 1.46 1.46 1.46 1.45 1.45 1.44 1.43
13 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49 1.48 1.47 1.47 1.47 1.46 1.46 1.46 1.45 1.45 1.45 1.45 1.44 1.44 1.44 1.44 1.44 1.44 1.44 1.43 1.43 1.43 1.42 1.42 1.41
14 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47 1.46 1.46 1.45 1.45 1.44 1.44 1.44 1.44 1.43 1.43 1.43 1.43 1.42 1.42 1.42 1.42 1.42 1.42 1.42 1.41 1.41 1.41 1.40 1.39
15 1.43 1.52 1.52 1.51 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.44 1.43 1.43 1.43 1.42 1.42 1.42 1.41 1.41 1.41 1.41 1.41 1.41 1.40 1.40 1.40 1.40 1.40 1.40 1.39 1.38 1.37
16 1.42 1.51 1.51 1.50 1.48 1.47 1.46 1.45 1.44 1.44 1.43 1.43 1.42 1.42 1.41 1.41 1.41 1.40 1.40 1.40 1.40 1.39 1.39 1.39 1.39 1.39 1.39 1.39 1.38 1.38 1.37 1.36 1.35
17 1.42 1.51 1.50 1.49 1.47 1.46 1.45 1.44 1.43 1.43 1.42 1.41 1.41 1.41 1.40 1.40 1.39 1.39 1.39 1.39 1.38 1.38 1.38 1.38 1.38 1.38 1.37 1.37 1.37 1.37 1.36 1.35 1.34
18 1.41 1.50 1.49 1.48 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40 1.40 1.40 1.39 1.39 1.38 1.38 1.38 1.38 1.37 1.37 1.37 1.37 1.37 1.36 1.36 1.36 1.36 1.36 1.35 1.34 1.33
19 1.41 1.49 1.49 1.47 1.46 1.44 1.43 1.42 1.41 1.41 1.40 1.40 1.39 1.39 1.38 1.38 1.37 1.37 1.37 1.37 1.36 1.36 1.36 1.36 1.36 1.35 1.35 1.35 1.35 1.35 1.34 1.33 1.32
20 1.40 1.49 1.48 1.47 1.45 1.44 1.43 1.42 1.41 1.40 1.39 1.39 1.38 1.38 1.37 1.37 1.37 1.36 1.36 1.36 1.36 1.35 1.35 1.35 1.35 1.35 1.34 1.34 1.34 1.34 1.33 1.32 1.31
21 1.40 1.48 1.48 1.46 1.44 1.43 1.42 1.41 1.40 1.39 1.39 1.38 1.37 1.37 1.37 1.36 1.36 1.36 1.35 1.35 1.35 1.35 1.34 1.34 1.34 1.34 1.34 1.33 1.33 1.33 1.32 1.31 1.30
22 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39 1.39 1.38 1.37 1.37 1.36 1.36 1.36 1.35 1.35 1.35 1.34 1.34 1.34 1.34 1.33 1.33 1.33 1.33 1.33 1.33 1.32 1.31 1.30 1.29
23 1.39 1.47 1.47 1.45 1.43 1.42 1.41 1.40 1.39 1.38 1.37 1.37 1.36 1.36 1.35 1.35 1.35 1.34 1.34 1.34 1.33 1.33 1.33 1.33 1.33 1.32 1.32 1.32 1.32 1.32 1.31 1.30 1.28
24 1.39 1.47 1.46 1.44 1.43 1.41 1.40 1.39 1.38 1.38 1.37 1.36 1.36 1.35 1.35 1.34 1.34 1.34 1.33 1.33 1.33 1.33 1.32 1.32 1.32 1.32 1.32 1.31 1.31 1.31 1.30 1.29 1.28
25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.36 1.35 1.35 1.34 1.34 1.33 1.33 1.33 1.33 1.32 1.32 1.32 1.32 1.31 1.31 1.31 1.31 1.31 1.31 1.29 1.28 1.27
26 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.37 1.36 1.35 1.35 1.34 1.34 1.33 1.33 1.33 1.32 1.32 1.32 1.32 1.31 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.29 1.28 1.26
27 1.38 1.46 1.45 1.43 1.42 1.40 1.39 1.38 1.37 1.36 1.35 1.35 1.34 1.34 1.33 1.33 1.33 1.32 1.32 1.32 1.31 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.30 1.30 1.28 1.27 1.26
28 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.33 1.32 1.32 1.32 1.31 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.30 1.29 1.29 1.29 1.28 1.27 1.25
29 1.38 1.45 1.45 1.43 1.41 1.40 1.38 1.37 1.36 1.35 1.35 1.34 1.33 1.33 1.32 1.32 1.32 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.29 1.27 1.26 1.25
30 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.33 1.32 1.32 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.29 1.28 1.28 1.27 1.26 1.24
31 1.37 1.45 1.44 1.42 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.33 1.33 1.32 1.32 1.31 1.31 1.31 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.29 1.28 1.28 1.28 1.28 1.27 1.25 1.24
32 1.37 1.45 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.34 1.33 1.32 1.32 1.31 1.31 1.31 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.28 1.28 1.28 1.28 1.28 1.28 1.26 1.25 1.23
33 1.37 1.45 1.44 1.42 1.40 1.38 1.37 1.36 1.35 1.34 1.33 1.33 1.32 1.32 1.31 1.31 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.28 1.28 1.28 1.28 1.27 1.27 1.27 1.26 1.25 1.23
34 1.37 1.44 1.43 1.42 1.40 1.38 1.37 1.36 1.35 1.34 1.33 1.33 1.32 1.31 1.31 1.30 1.30 1.30 1.29 1.29 1.29 1.28 1.28 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.26 1.24 1.23
35 1.37 1.44 1.43 1.41 1.40 1.38 1.37 1.36 1.35 1.34 1.33 1.32 1.32 1.31 1.31 1.30 1.30 1.29 1.29 1.29 1.28 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.27 1.27 1.25 1.24 1.22
36 1.37 1.44 1.43 1.41 1.39 1.38 1.36 1.35 1.34 1.33 1.33 1.32 1.31 1.31 1.30 1.30 1.30 1.29 1.29 1.29 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.27 1.26 1.26 1.25 1.24 1.22
37 1.37 1.44 1.43 1.41 1.39 1.38 1.36 1.35 1.34 1.33 1.32 1.32 1.31 1.31 1.30 1.30 1.29 1.29 1.29 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.27 1.26 1.26 1.26 1.25 1.23 1.22
38 1.36 1.44 1.43 1.41 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.32 1.31 1.30 1.30 1.29 1.29 1.29 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.26 1.26 1.26 1.26 1.26 1.24 1.23 1.21
39 1.36 1.44 1.43 1.41 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.31 1.30 1.30 1.29 1.29 1.28 1.28 1.28 1.27 1.27 1.27 1.27 1.26 1.26 1.26 1.26 1.26 1.26 1.24 1.23 1.21
40 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.31 1.30 1.30 1.29 1.29 1.28 1.28 1.28 1.27 1.27 1.27 1.26 1.26 1.26 1.26 1.26 1.25 1.25 1.24 1.22 1.21
60 1.35 1.42 1.41 1.38 1.37 1.35 1.33 1.32 1.31 1.30 1.29 1.29 1.28 1.27 1.27 1.26 1.26 1.26 1.25 1.25 1.24 1.24 1.24 1.24 1.23 1.23 1.23 1.23 1.22 1.22 1.21 1.19 1.17
120 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29 1.28 1.27 1.26 1.26 1.25 1.24 1.24 1.23 1.23 1.22 1.22 1.22 1.21 1.21 1.21 1.20 1.20 1.20 1.20 1.19 1.19 1.18 1.16 1.13

268
Distribución F de Fisher ( F 0.10,ν 1 ,ν 2 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 28 29 30 40 60 120
1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 60.47 60.71 60.90 61.07 61.22 61.35 61.46 61.57 61.66 61.74 61.81 61.88 61.94 62.00 62.05 62.10 62.19 62.23 62.26 62.53 62.79 63.06
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.42 9.43 9.43 9.44 9.44 9.44 9.44 9.45 9.45 9.45 9.45 9.45 9.46 9.46 9.46 9.47 9.47 9.48
3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.20 5.20 5.19 5.19 5.19 5.18 5.18 5.18 5.18 5.18 5.17 5.17 5.17 5.17 5.17 5.16 5.15 5.14
4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.87 3.86 3.86 3.85 3.85 3.84 3.84 3.84 3.83 3.83 3.83 3.83 3.82 3.82 3.82 3.80 3.79 3.78
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.24 3.23 3.22 3.22 3.21 3.21 3.20 3.20 3.19 3.19 3.19 3.18 3.18 3.18 3.17 3.16 3.14 3.12
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.87 2.86 2.85 2.85 2.84 2.84 2.83 2.83 2.82 2.82 2.81 2.81 2.81 2.80 2.80 2.78 2.76 2.74
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.62 2.61 2.61 2.60 2.59 2.59 2.58 2.58 2.58 2.57 2.57 2.56 2.56 2.56 2.54 2.51 2.49
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.46 2.45 2.45 2.44 2.43 2.42 2.42 2.41 2.41 2.40 2.40 2.40 2.39 2.39 2.38 2.36 2.34 2.32
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.33 2.32 2.31 2.30 2.30 2.29 2.29 2.28 2.28 2.27 2.27 2.26 2.26 2.25 2.23 2.21 2.18
10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.24 2.23 2.22 2.22 2.21 2.20 2.19 2.19 2.18 2.18 2.17 2.17 2.16 2.16 2.16 2.13 2.11 2.08
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.17 2.16 2.15 2.14 2.13 2.12 2.12 2.11 2.11 2.10 2.10 2.09 2.08 2.08 2.08 2.05 2.03 2.00
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.09 2.08 2.08 2.07 2.06 2.05 2.05 2.04 2.04 2.03 2.03 2.02 2.01 2.01 1.99 1.96 1.93
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.04 2.03 2.02 2.01 2.01 2.00 1.99 1.99 1.98 1.98 1.97 1.96 1.96 1.96 1.93 1.90 1.88
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.01 2.00 1.99 1.98 1.97 1.96 1.96 1.95 1.94 1.94 1.93 1.93 1.92 1.92 1.91 1.89 1.86 1.83
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.95 1.94 1.93 1.92 1.92 1.91 1.90 1.90 1.89 1.89 1.88 1.88 1.87 1.85 1.82 1.79
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.88 1.87 1.87 1.86 1.86 1.85 1.84 1.84 1.81 1.78 1.75
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.90 1.89 1.88 1.87 1.86 1.86 1.85 1.84 1.84 1.83 1.83 1.82 1.81 1.81 1.78 1.75 1.72
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.89 1.87 1.86 1.85 1.84 1.84 1.83 1.82 1.82 1.81 1.80 1.80 1.79 1.79 1.78 1.75 1.72 1.69
19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.86 1.85 1.84 1.83 1.82 1.81 1.81 1.80 1.79 1.79 1.78 1.78 1.77 1.76 1.76 1.73 1.70 1.67
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.83 1.82 1.81 1.80 1.79 1.79 1.78 1.77 1.77 1.76 1.76 1.75 1.74 1.74 1.71 1.68 1.64
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 1.92 1.90 1.87 1.86 1.84 1.83 1.81 1.80 1.79 1.78 1.78 1.77 1.76 1.75 1.75 1.74 1.74 1.73 1.72 1.72 1.69 1.66 1.62
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 1.88 1.86 1.84 1.83 1.81 1.80 1.79 1.78 1.77 1.76 1.75 1.74 1.74 1.73 1.73 1.72 1.71 1.71 1.70 1.67 1.64 1.60
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 1.89 1.87 1.84 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.74 1.74 1.73 1.72 1.72 1.71 1.70 1.69 1.69 1.69 1.66 1.62 1.59
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 1.85 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.74 1.73 1.72 1.71 1.71 1.70 1.70 1.69 1.68 1.68 1.67 1.64 1.61 1.57
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.84 1.82 1.80 1.79 1.77 1.76 1.75 1.74 1.73 1.72 1.71 1.70 1.70 1.69 1.68 1.68 1.67 1.66 1.66 1.63 1.59 1.56
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 1.83 1.81 1.79 1.77 1.76 1.75 1.73 1.72 1.71 1.71 1.70 1.69 1.68 1.68 1.67 1.67 1.66 1.65 1.65 1.61 1.58 1.54
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 1.85 1.82 1.80 1.78 1.76 1.75 1.74 1.72 1.71 1.70 1.70 1.69 1.68 1.67 1.67 1.66 1.65 1.64 1.64 1.64 1.60 1.57 1.53
28 2.89 2.50 2.29 2.06 2.00 1.94 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.74 1.73 1.71 1.70 1.69 1.69 1.68 1.67 1.66 1.66 1.65 1.64 1.63 1.63 1.63 1.59 1.56 1.52
29 2.89 2.50 2.28 2.15 兟 2. 2.06 1.99 1.93 1.89 1.86 1.83 1.80 1.78 1.76 1.75 1.73 1.72 1.71 1.69 1.68 1.68 1.67 1.66 1.65 1.65 1.64 1.63 1.62 1.62 1.62 1.58 1.55 1.51
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.72 1.71 1.70 1.69 1.68 1.67 1.66 1.65 1.64 1.64 1.63 1.63 1.62 1.61 1.61 1.57 1.54 1.50
31 2.87 2.48 2.27 2.14 2.04 1.97 1.92 1.88 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.69 1.68 1.67 1.66 1.65 1.64 1.64 1.63 1.62 1.62 1.61 1.60 1.60 1.56 1.53 1.49
32 2.87 2.48 2.26 2.13 2.04 1.97 1.91 1.87 1.83 1.81 1.78 1.76 1.74 1.72 1.71 1.69 1.68 1.67 1.66 1.65 1.64 1.64 1.63 1.62 1.62 1.61 1.60 1.59 1.59 1.56 1.52 1.48
33 2.86 2.47 2.26 2.12 2.03 1.96 1.91 1.86 1.83 1.80 1.77 1.75 1.73 1.72 1.70 1.69 1.67 1.66 1.65 1.64 1.64 1.63 1.62 1.61 1.61 1.60 1.59 1.59 1.58 1.55 1.51 1.47
34 2.86 2.47 2.25 2.12 2.02 1.96 1.90 1.86 1.82 1.79 1.77 1.75 1.73 1.71 1.69 1.68 1.67 1.66 1.65 1.64 1.63 1.62 1.61 1.61 1.60 1.60 1.59 1.58 1.58 1.54 1.50 1.46
35 2.85 2.46 2.25 2.11 2.02 1.95 1.90 1.85 1.82 1.79 1.76 1.74 1.72 1.70 1.69 1.67 1.66 1.65 1.64 1.63 1.62 1.62 1.61 1.60 1.60 1.59 1.58 1.57 1.57 1.53 1.50 1.46
36 2.85 2.46 2.24 2.11 2.01 1.94 1.89 1.85 1.81 1.78 1.76 1.73 1.71 1.70 1.68 1.67 1.66 1.65 1.64 1.63 1.62 1.61 1.60 1.60 1.59 1.58 1.57 1.57 1.56 1.53 1.49 1.45
37 2.85 2.45 2.24 2.10 2.01 1.94 1.89 1.84 1.81 1.78 1.75 1.73 1.71 1.69 1.68 1.66 1.65 1.64 1.63 1.62 1.61 1.60 1.60 1.59 1.58 1.58 1.57 1.56 1.56 1.52 1.48 1.44
38 2.84 2.45 2.23 2.10 2.01 1.94 1.88 1.84 1.80 1.77 1.75 1.72 1.70 1.69 1.67 1.66 1.65 1.63 1.62 1.61 1.61 1.60 1.59 1.58 1.58 1.57 1.56 1.56 1.55 1.52 1.48 1.44
39 2.84 2.44 2.23 2.09 2.00 1.93 1.88 1.83 1.80 1.77 1.74 1.72 1.70 1.68 1.67 1.65 1.64 1.63 1.62 1.61 1.60 1.59 1.59 1.58 1.57 1.57 1.56 1.55 1.55 1.51 1.47 1.43
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.66 1.65 1.64 1.62 1.61 1.61 1.60 1.59 1.58 1.57 1.57 1.56 1.55 1.55 1.54 1.51 1.47 1.42
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.68 1.66 1.64 1.62 1.60 1.59 1.58 1.56 1.55 1.54 1.53 1.53 1.52 1.51 1.50 1.50 1.49 1.48 1.48 1.44 1.40 1.35
120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.63 1.60 1.58 1.56 1.55 1.53 1.52 1.50 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.43 1.42 1.41 1.41 1.37 1.32 1.26

269
Distribución F de Fisher ( F 0.05, ν1 , ν 2 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 28 29 30 40 60 120
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 248.3 248.6 248.8 249.1 249.3 249.5 249.8 250.0 250.1 251.1 252.2 253.3
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 19.45 19.45 19.45 19.45 19.46 19.46 19.46 19.46 19.46 19.47 19.48 19.49
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66 8.65 8.65 8.64 8.64 8.63 8.63 8.62 8.62 8.62 8.59 8.57 8.55
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80 5.79 5.79 5.78 5.77 5.77 5.76 5.75 5.75 5.75 5.72 5.69 5.66
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56 4.55 4.54 4.53 4.53 4.52 4.52 4.50 4.50 4.50 4.46 4.43 4.40
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87 3.86 3.86 3.85 3.84 3.83 3.83 3.82 3.81 3.81 3.77 3.74 3.70
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44 3.43 3.43 3.42 3.41 3.40 3.40 3.39 3.38 3.38 3.34 3.30 3.27
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15 3.14 3.13 3.12 3.12 3.11 3.10 3.09 3.08 3.08 3.04 3.01 2.97
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 2.93 2.92 2.91 2.90 2.89 2.89 2.87 2.87 2.86 2.83 2.79 2.75
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77 2.76 2.75 2.75 2.74 2.73 2.72 2.71 2.70 2.70 2.66 2.62 2.58
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.65 2.64 2.63 2.62 2.61 2.60 2.59 2.58 2.58 2.57 2.53 2.49 2.45
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54 2.53 2.52 2.51 2.51 2.50 2.49 2.48 2.47 2.47 2.43 2.38 2.34
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46 2.45 2.44 2.43 2.42 2.41 2.41 2.39 2.39 2.38 2.34 2.30 2.25
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 2.38 2.37 2.36 2.35 2.34 2.33 2.32 2.31 2.31 2.27 2.22 2.18
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33 2.32 2.31 2.30 2.29 2.28 2.27 2.26 2.25 2.25 2.20 2.16 2.11
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28 2.26 2.25 2.24 2.24 2.23 2.22 2.21 2.20 2.19 2.15 2.11 2.06
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23 2.22 2.21 2.20 2.19 2.18 2.17 2.16 2.15 2.15 2.10 2.06 2.01
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19 2.18 2.17 2.16 2.15 2.14 2.13 2.12 2.11 2.11 2.06 2.02 1.97
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16 2.14 2.13 2.12 2.11 2.11 2.10 2.08 2.08 2.07 2.03 1.98 1.93
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 2.11 2.10 2.09 2.08 2.07 2.07 2.05 2.05 2.04 1.99 1.95 1.90
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10 2.08 2.07 2.06 2.05 2.05 2.04 2.02 2.02 2.01 1.96 1.92 1.87
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 2.06 2.05 2.04 2.03 2.02 2.01 2.00 1.99 1.98 1.94 1.89 1.84
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 2.04 2.02 2.01 2.01 2.00 1.99 1.97 1.97 1.96 1.91 1.86 1.81
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.15 2.13 2.11 2.09 2.07 2.05 2.04 2.03 2.01 2.00 1.99 1.98 1.97 1.97 1.95 1.95 1.94 1.89 1.84 1.79
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.14 2.11 2.09 2.07 2.05 2.04 2.02 2.01 2.00 1.98 1.97 1.96 1.96 1.95 1.93 1.93 1.92 1.87 1.82 1.77
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.12 2.09 2.07 2.05 2.03 2.02 2.00 1.99 1.98 1.97 1.96 1.95 1.94 1.93 1.91 1.91 1.90 1.85 1.80 1.75
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.17 2.13 2.10 2.08 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.95 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.84 1.79 1.73
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.95 1.93 1.92 1.91 1.91 1.90 1.88 1.88 1.87 1.82 1.77 1.71
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.08 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.87 1.86 1.85 1.81 1.75 1.70
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.01 1.99 1.98 1.96 1.95 1.93 1.92 1.91 1.90 1.89 1.88 1.87 1.85 1.85 1.84 1.79 1.74 1.68
31 4.16 3.30 2.91 2.68 2.52 2.41 2.32 2.25 2.20 2.15 2.11 2.08 2.05 2.03 2.00 1.98 1.96 1.95 1.93 1.92 1.91 1.90 1.88 1.88 1.87 1.86 1.84 1.83 1.83 1.78 1.73 1.67
32 4.15 3.29 2.90 2.67 2.51 2.40 2.31 2.24 2.19 2.14 2.10 2.07 2.04 2.01 1.99 1.97 1.95 1.94 1.92 1.91 1.90 1.88 1.87 1.86 1.85 1.85 1.83 1.82 1.82 1.77 1.71 1.66
33 4.14 3.28 2.89 2.66 2.50 2.39 2.30 2.23 2.18 2.13 2.09 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.90 1.89 1.87 1.86 1.85 1.84 1.83 1.82 1.81 1.81 1.76 1.70 1.64
34 4.13 3.28 2.88 2.65 2.49 2.38 2.29 2.23 2.17 2.12 2.08 2.05 2.02 1.99 1.97 1.95 1.93 1.92 1.90 1.89 1.88 1.86 1.85 1.84 1.83 1.82 1.81 1.80 1.80 1.75 1.69 1.63
35 4.12 3.27 2.87 2.64 2.49 2.37 2.29 2.22 2.16 2.11 2.07 2.04 2.01 1.99 1.96 1.94 1.92 1.91 1.89 1.88 1.87 1.85 1.84 1.83 1.82 1.82 1.80 1.79 1.79 1.74 1.68 1.62
36 4.11 3.26 2.87 2.63 2.48 2.36 2.28 2.21 2.15 2.11 2.07 2.03 2.00 1.98 1.95 1.93 1.92 1.90 1.88 1.87 1.86 1.85 1.83 1.82 1.81 1.81 1.79 1.78 1.78 1.73 1.67 1.61
37 4.11 3.25 2.86 2.63 2.47 2.36 2.27 2.20 2.14 2.10 2.06 2.02 2.00 1.97 1.95 1.93 1.91 1.89 1.88 1.86 1.85 1.84 1.83 1.82 1.81 1.80 1.78 1.77 1.77 1.72 1.66 1.60
38 4.10 3.24 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 1.99 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.83 1.82 1.81 1.80 1.79 1.77 1.77 1.76 1.71 1.65 1.59
39 4.09 3.24 2.85 2.61 2.46 2.34 2.26 2.19 2.13 2.08 2.04 2.01 1.98 1.95 1.93 1.91 1.89 1.88 1.86 1.85 1.83 1.82 1.81 1.80 1.79 1.78 1.77 1.76 1.75 1.70 1.65 1.58
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.97 1.95 1.92 1.90 1.89 1.87 1.85 1.84 1.83 1.81 1.80 1.79 1.78 1.77 1.76 1.75 1.74 1.69 1.64 1.58
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.78 1.76 1.75 1.73 1.72 1.71 1.70 1.69 1.68 1.66 1.66 1.65 1.59 1.53 1.47
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.87 1.83 1.80 1.78 1.75 1.73 1.71 1.69 1.67 1.66 1.64 1.63 1.62 1.61 1.60 1.59 1.57 1.56 1.55 1.50 1.43 1.35

270
Distribución F de Fisher ( F 0.025,ν1 , ν 2 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 28 29 30 40 60 120
1 648 799 864 900 922 937 948 957 963 969 973 977 980 983 985 987 989 990 992 993 994 995 996 997 998 999 1000 1001 1001 1006 1010 1014
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.41 39.42 39.43 39.43 39.44 39.44 39.44 39.45 39.45 39.45 39.45 39.45 39.46 39.46 39.46 39.46 39.46 39.46 39.47 39.48 39.49
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.37 14.34 14.30 14.28 14.25 14.23 14.21 14.20 14.18 14.17 14.16 14.14 14.13 14.12 14.12 14.11 14.09 14.09 14.08 14.04 13.99 13.95
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.72 8.68 8.66 8.63 8.61 8.59 8.58 8.56 8.55 8.53 8.52 8.51 8.50 8.49 8.48 8.47 8.46 8.41 8.36 8.31
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.40 6.38 6.36 6.34 6.33 6.31 6.30 6.29 6.28 6.27 6.26 6.24 6.23 6.23 6.18 6.12 6.07
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.24 5.22 5.20 5.18 5.17 5.15 5.14 5.13 5.12 5.11 5.10 5.08 5.07 5.07 5.01 4.96 4.90
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.54 4.52 4.50 4.48 4.47 4.45 4.44 4.43 4.41 4.40 4.39 4.38 4.37 4.36 4.31 4.25 4.20
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.08 4.05 4.03 4.02 4.00 3.98 3.97 3.96 3.95 3.94 3.93 3.91 3.90 3.89 3.84 3.78 3.73
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.74 3.72 3.70 3.68 3.67 3.65 3.64 3.63 3.61 3.60 3.59 3.58 3.57 3.56 3.51 3.45 3.39
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.50 3.47 3.45 3.44 3.42 3.40 3.39 3.38 3.37 3.35 3.34 3.33 3.32 3.31 3.26 3.20 3.14
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.30 3.28 3.26 3.24 3.23 3.21 3.20 3.18 3.17 3.16 3.15 3.13 3.13 3.12 3.06 3.00 2.94
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.15 3.13 3.11 3.09 3.07 3.06 3.04 3.03 3.02 3.01 3.00 2.98 2.97 2.96 2.91 2.85 2.79
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.20 3.15 3.12 3.08 3.05 3.03 3.00 2.98 2.96 2.95 2.93 2.92 2.91 2.89 2.88 2.87 2.85 2.85 2.84 2.78 2.72 2.66
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.84 2.83 2.81 2.80 2.79 2.78 2.77 2.75 2.74 2.73 2.67 2.61 2.55
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.84 2.81 2.79 2.77 2.76 2.74 2.73 2.71 2.70 2.69 2.68 2.66 2.65 2.64 2.59 2.52 2.46
16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.61 2.60 2.58 2.58 2.57 2.51 2.45 2.38
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.70 2.67 2.65 2.63 2.62 2.60 2.59 2.57 2.56 2.55 2.54 2.52 2.51 2.50 2.44 2.38 2.32
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.64 2.62 2.60 2.58 2.56 2.54 2.53 2.52 2.50 2.49 2.48 2.46 2.45 2.44 2.38 2.32 2.26
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.59 2.57 2.55 2.53 2.51 2.49 2.48 2.46 2.45 2.44 2.43 2.41 2.40 2.39 2.33 2.27 2.20
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.55 2.52 2.50 2.48 2.46 2.45 2.43 2.42 2.41 2.40 2.39 2.37 2.36 2.35 2.29 2.22 2.16
21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.68 2.64 2.60 2.56 2.53 2.51 2.48 2.46 2.44 2.42 2.41 2.39 2.38 2.37 2.36 2.34 2.33 2.32 2.31 2.25 2.18 2.11
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.65 2.60 2.56 2.53 2.50 2.47 2.45 2.43 2.41 2.39 2.37 2.36 2.34 2.33 2.32 2.31 2.29 2.28 2.27 2.21 2.14 2.08
23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.67 2.62 2.57 2.53 2.50 2.47 2.44 2.42 2.39 2.37 2.36 2.34 2.33 2.31 2.30 2.29 2.28 2.26 2.25 2.24 2.18 2.11 2.04
24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.59 2.54 2.50 2.47 2.44 2.41 2.39 2.36 2.35 2.33 2.31 2.30 2.28 2.27 2.26 2.25 2.23 2.22 2.21 2.15 2.08 2.01
25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.56 2.51 2.48 2.44 2.41 2.38 2.36 2.34 2.32 2.30 2.28 2.27 2.26 2.24 2.23 2.22 2.20 2.19 2.18 2.12 2.05 1.98
26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.54 2.49 2.45 2.42 2.39 2.36 2.34 2.31 2.29 2.28 2.26 2.24 2.23 2.22 2.21 2.19 2.17 2.17 2.16 2.09 2.03 1.95
27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.57 2.51 2.47 2.43 2.39 2.36 2.34 2.31 2.29 2.27 2.25 2.24 2.22 2.21 2.19 2.18 2.17 2.15 2.14 2.13 2.07 2.00 1.93
28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.49 2.45 2.41 2.37 2.34 2.32 2.29 2.27 2.25 2.23 2.22 2.20 2.19 2.17 2.16 2.15 2.13 2.12 2.11 2.05 1.98 1.91
29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 2.53 2.48 2.43 2.39 2.36 2.32 2.30 2.27 2.25 2.23 2.21 2.20 2.18 2.17 2.15 2.14 2.13 2.11 2.10 2.09 2.03 1.96 1.89
30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.46 2.41 2.37 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.16 2.15 2.14 2.12 2.11 2.09 2.08 2.07 2.01 1.94 1.87
31 5.55 4.16 3.57 3.23 3.01 2.85 2.73 2.64 2.56 2.50 2.44 2.40 2.36 2.32 2.29 2.26 2.24 2.22 2.20 2.18 2.16 2.15 2.13 2.12 2.11 2.10 2.07 2.07 2.06 1.99 1.92 1.85
32 5.53 4.15 3.56 3.22 3.00 2.84 2.71 2.62 2.54 2.48 2.43 2.38 2.34 2.31 2.28 2.25 2.22 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.08 2.06 2.05 2.04 1.98 1.91 1.83
33 5.51 4.13 3.54 3.20 2.98 2.82 2.70 2.61 2.53 2.47 2.41 2.37 2.33 2.29 2.26 2.23 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.09 2.08 2.06 2.04 2.03 2.03 1.96 1.89 1.81
34 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45 2.40 2.35 2.31 2.28 2.25 2.22 2.20 2.17 2.15 2.13 2.12 2.10 2.09 2.07 2.06 2.05 2.03 2.02 2.01 1.95 1.88 1.80
35 5.48 4.11 3.52 3.18 2.96 2.80 2.68 2.58 2.50 2.44 2.39 2.34 2.30 2.27 2.23 2.21 2.18 2.16 2.14 2.12 2.10 2.09 2.07 2.06 2.05 2.04 2.02 2.01 2.00 1.93 1.86 1.79
36 5.47 4.09 3.50 3.17 2.94 2.78 2.66 2.57 2.49 2.43 2.37 2.33 2.29 2.25 2.22 2.20 2.17 2.15 2.13 2.11 2.09 2.08 2.06 2.05 2.04 2.03 2.00 2.00 1.99 1.92 1.85 1.77
37 5.46 4.08 3.49 3.16 2.93 2.77 2.65 2.56 2.48 2.42 2.36 2.32 2.28 2.24 2.21 2.18 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.04 2.03 2.01 1.99 1.98 1.97 1.91 1.84 1.76
38 5.45 4.07 3.48 3.15 2.92 2.76 2.64 2.55 2.47 2.41 2.35 2.31 2.27 2.23 2.20 2.17 2.15 2.13 2.11 2.09 2.07 2.05 2.04 2.03 2.01 2.00 1.98 1.97 1.96 1.90 1.82 1.75
39 5.43 4.06 3.47 3.14 2.91 2.75 2.63 2.54 2.46 2.40 2.34 2.30 2.26 2.22 2.19 2.16 2.14 2.12 2.10 2.08 2.06 2.04 2.03 2.02 2.00 1.99 1.97 1.96 1.95 1.89 1.81 1.74
40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.33 2.29 2.25 2.21 2.18 2.15 2.13 2.11 2.09 2.07 2.05 2.03 2.02 2.01 1.99 1.98 1.96 1.95 1.94 1.88 1.80 1.72
60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.22 2.17 2.13 2.09 2.06 2.03 2.01 1.98 1.96 1.94 1.93 1.91 1.90 1.88 1.87 1.86 1.83 1.82 1.82 1.74 1.67 1.58
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.10 2.05 2.01 1.98 1.94 1.92 1.89 1.87 1.84 1.82 1.81 1.79 1.77 1.76 1.75 1.73 1.71 1.70 1.69 1.61 1.53 1.43

271
Distribución F de Fisher ( F 0.01, ν1 , ν 2 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 28 29 30 40 60 120
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6126 6143 6157 6170 6181 6191 6201 6209 6216 6223 6229 6234 6240 6245 6253 6257 6260 6286 6313 6340
2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.42 99.43 99.43 99.44 99.44 99.44 99.45 99.45 99.45 99.46 99.46 99.46 99.46 99.46 99.46 99.46 99.47 99.48 99.48 99.49
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.98 26.92 26.87 26.83 26.79 26.75 26.72 26.69 26.66 26.64 26.62 26.60 26.58 26.56 26.53 26.52 26.50 26.41 26.32 26.22
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 14.20 14.15 14.11 14.08 14.05 14.02 13.99 13.97 13.95 13.93 13.91 13.89 13.86 13.85 13.84 13.75 13.65 13.56
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 9.72 9.68 9.64 9.61 9.58 9.55 9.53 9.51 9.49 9.47 9.45 9.43 9.40 9.39 9.38 9.29 9.20 9.11
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 7.56 7.52 7.48 7.45 7.42 7.40 7.37 7.35 7.33 7.31 7.30 7.28 7.25 7.24 7.23 7.14 7.06 6.97
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.28 6.24 6.21 6.18 6.16 6.13 6.11 6.09 6.07 6.06 6.04 6.02 6.00 5.99 5.91 5.82 5.74
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48 5.44 5.41 5.38 5.36 5.34 5.32 5.30 5.28 5.26 5.25 5.22 5.21 5.20 5.12 5.03 4.95
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.96 4.92 4.89 4.86 4.83 4.81 4.79 4.77 4.75 4.73 4.71 4.70 4.67 4.66 4.65 4.57 4.48 4.40
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52 4.49 4.46 4.43 4.41 4.38 4.36 4.34 4.33 4.31 4.30 4.27 4.26 4.25 4.17 4.08 4.00
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.21 4.18 4.15 4.12 4.10 4.08 4.06 4.04 4.02 4.01 3.99 3.96 3.95 3.94 3.86 3.78 3.69
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97 3.94 3.91 3.88 3.86 3.84 3.82 3.80 3.78 3.76 3.75 3.72 3.71 3.70 3.62 3.54 3.45
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78 3.75 3.72 3.69 3.66 3.64 3.62 3.60 3.59 3.57 3.56 3.53 3.52 3.51 3.43 3.34 3.25
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62 3.59 3.56 3.53 3.51 3.48 3.46 3.44 3.43 3.41 3.40 3.37 3.36 3.35 3.27 3.18 3.09
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49 3.45 3.42 3.40 3.37 3.35 3.33 3.31 3.29 3.28 3.26 3.24 3.23 3.21 3.13 3.05 2.96
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37 3.34 3.31 3.28 3.26 3.24 3.22 3.20 3.18 3.16 3.15 3.12 3.11 3.10 3.02 2.93 2.84
17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27 3.24 3.21 3.19 3.16 3.14 3.12 3.10 3.08 3.07 3.05 3.03 3.01 3.00 2.92 2.83 2.75
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19 3.16 3.13 3.10 3.08 3.05 3.03 3.02 3.00 2.98 2.97 2.94 2.93 2.92 2.84 2.75 2.66
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12 3.08 3.05 3.03 3.00 2.98 2.96 2.94 2.92 2.91 2.89 2.87 2.86 2.84 2.76 2.67 2.58
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05 3.02 2.99 2.96 2.94 2.92 2.90 2.88 2.86 2.84 2.83 2.80 2.79 2.78 2.69 2.61 2.52
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.24 3.17 3.12 3.07 3.03 2.99 2.96 2.93 2.90 2.88 2.86 2.84 2.82 2.80 2.79 2.77 2.74 2.73 2.72 2.64 2.55 2.46
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.07 3.02 2.98 2.94 2.91 2.88 2.85 2.83 2.81 2.78 2.77 2.75 2.73 2.72 2.69 2.68 2.67 2.58 2.50 2.40
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 3.02 2.97 2.93 2.89 2.86 2.83 2.80 2.78 2.76 2.74 2.72 2.70 2.69 2.67 2.64 2.63 2.62 2.54 2.45 2.35
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.09 3.03 2.98 2.93 2.89 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.68 2.66 2.64 2.63 2.60 2.59 2.58 2.49 2.40 2.31
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 3.06 2.99 2.94 2.89 2.85 2.81 2.78 2.75 2.72 2.70 2.68 2.66 2.64 2.62 2.60 2.59 2.56 2.55 2.54 2.45 2.36 2.27
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 3.02 2.96 2.90 2.86 2.81 2.78 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.55 2.53 2.51 2.50 2.42 2.33 2.23
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.99 2.93 2.87 2.82 2.78 2.75 2.71 2.68 2.66 2.63 2.61 2.59 2.57 2.55 2.54 2.52 2.49 2.48 2.47 2.38 2.29 2.20
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.96 2.90 2.84 2.79 2.75 2.72 2.68 2.65 2.63 2.60 2.58 2.56 2.54 2.52 2.51 2.49 2.46 2.45 2.44 2.35 2.26 2.17
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.93 2.87 2.81 2.77 2.73 2.69 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.48 2.46 2.44 2.42 2.41 2.33 2.23 2.14
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.45 2.44 2.41 2.40 2.39 2.30 2.21 2.11
31 7.53 5.36 4.48 3.99 3.67 3.45 3.28 3.15 3.04 2.96 2.88 2.82 2.77 2.72 2.68 2.64 2.61 2.58 2.55 2.52 2.50 2.48 2.46 2.45 2.43 2.41 2.39 2.37 2.36 2.27 2.18 2.09
32 7.50 5.34 4.46 3.97 3.65 3.43 3.26 3.13 3.02 2.93 2.86 2.80 2.74 2.70 2.65 2.62 2.58 2.55 2.53 2.50 2.48 2.46 2.44 2.42 2.41 2.39 2.36 2.35 2.34 2.25 2.16 2.06
33 7.47 5.31 4.44 3.95 3.63 3.41 3.24 3.11 3.00 2.91 2.84 2.78 2.72 2.68 2.63 2.60 2.56 2.53 2.51 2.48 2.46 2.44 2.42 2.40 2.39 2.37 2.34 2.33 2.32 2.23 2.14 2.04
34 7.44 5.29 4.42 3.93 3.61 3.39 3.22 3.09 2.98 2.89 2.82 2.76 2.70 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.38 2.37 2.35 2.32 2.31 2.30 2.21 2.12 2.02
35 7.42 5.27 4.40 3.91 3.59 3.37 3.20 3.07 2.96 2.88 2.80 2.74 2.69 2.64 2.60 2.56 2.53 2.50 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.33 2.30 2.29 2.28 2.19 2.10 2.00
36 7.40 5.25 4.38 3.89 3.57 3.35 3.18 3.05 2.95 2.86 2.79 2.72 2.67 2.62 2.58 2.54 2.51 2.48 2.45 2.43 2.41 2.38 2.37 2.35 2.33 2.32 2.29 2.28 2.26 2.18 2.08 1.98
37 7.37 5.23 4.36 3.87 3.56 3.33 3.17 3.04 2.93 2.84 2.77 2.71 2.65 2.61 2.56 2.53 2.49 2.46 2.44 2.41 2.39 2.37 2.35 2.33 2.31 2.30 2.27 2.26 2.25 2.16 2.06 1.96
38 7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.92 2.83 2.75 2.69 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.28 2.26 2.24 2.23 2.14 2.05 1.95
39 7.33 5.19 4.33 3.84 3.53 3.30 3.14 3.01 2.90 2.81 2.74 2.68 2.62 2.58 2.54 2.50 2.46 2.43 2.41 2.38 2.36 2.34 2.32 2.30 2.29 2.27 2.24 2.23 2.22 2.13 2.03 1.93
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.61 2.56 2.52 2.48 2.45 2.42 2.39 2.37 2.35 2.33 2.31 2.29 2.27 2.26 2.23 2.22 2.20 2.11 2.02 1.92
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.44 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.17 2.15 2.13 2.12 2.10 2.08 2.05 2.04 2.03 1.94 1.84 1.73
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.40 2.34 2.28 2.23 2.19 2.15 2.12 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.93 1.92 1.89 1.87 1.86 1.76 1.66 1.53

272
Tabla IX - Valores Críticos de U en la Prueba de Mann - Whitney

En la primera tabla, las anotaciones corresponden a los valores críticos de U para una prueba de una
cola en 0.025 o para una prueba de dos colas en 0.05; en la segunda, para una prueba de una cola en
0.05 o para una prueba de dos colas en 0.10.

n1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n2
1
2 0 0 0 0 1 1 1 1 1 2 2 2 2
3 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8
4 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 13
5 0 1 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20
6 1 2 3 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27
7 1 3 5 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
8 0 2 4 6 8 10 13 15 17 19 22 24 26 29 31 34 36 38 41
9 0 2 4 7 10 12 15 17 20 23 26 28 31 34 37 39 42 45 48
10 0 3 5 8 11 14 17 20 23 26 29 33 36 39 42 45 48 52 55
11 0 3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58 62
12 1 4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65 69
13 1 4 8 12 16 20 24 28 33 37 41 45 50 54 59 63 67 72 76
14 1 5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 78 83
15 1 5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85 90
16 1 6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92 98
17 2 6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99 105
18 2 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106 112
19 2 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 113 119
20 2 8 13 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 127

n1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n2
1 0 0
2 0 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4
3 0 0 1 2 2 3 3 4 5 5 6 7 7 8 9 9 10 11
4 0 1 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18
5 0 1 2 4 5 6 8 9 11 12 13 15 16 18 19 20 22 23 25
6 0 2 3 5 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32
7 0 2 4 6 8 11 13 15 17 19 21 24 26 28 30 33 35 37 39
8 1 3 5 8 10 13 15 18 20 23 26 28 31 33 36 39 41 44 47
9 1 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54
10 1 4 7 11 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62
11 1 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69
12 2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77
13 2 6 10 15 19 24 28 33 37 42 47 51 56 61 65 70 75 80 84
14 2 7 11 16 21 26 31 36 41 46 51 56 61 66 71 77 82 87 92
15 3 7 12 18 23 28 33 39 44 50 55 61 66 72 77 83 88 94 100
16 3 8 14 19 25 30 36 42 48 54 60 65 71 77 83 89 95 101 107
17 3 9 15 20 26 33 39 45 51 57 64 70 77 83 89 96 102 109 115
18 4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123
19 0 4 10 17 23 30 37 44 51 58 65 72 80 87 94 101 109 116 123 130
20 0 4 11 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138

273
FUNCIONES DE CUANTÍA

n
Esperanza matemática: E [x ] = ∑ x i P ( x i ) para x = 0, 1, 2,K , n
i=1
n n 2
2  n 2 
Varianza esperada: i
V(x) = ∑ (x i − µ) P(x i ) = ∑ x P(x i ) −  ∑ x i P(x i ) 
i =1 i =1  i =1 

Moda esperada: Valor de la variable que corresponde a la probabilidad más alta.

Mediana esperada:
• Se determina los valores de probabilidad acumulada.

• Se ubica el valor 0.5 entre dos valores consecutivos de probabilidad acumulada: Pac (x i −1 ) ≤ 0.5 ≤ Pac (x i ) , tal
que si:

• Pac (x i ) > 0.5 entonces Me = x i


x + x i +1
• Pac (x i ) = 0.5 entonces Me = i
2

FUNCIONES DE DENSIDAD

Esperanza matemática: E [x ] = ∫x i f ( x i ) dx para − ∞ ≤ x ≤ ∞
−∞
∞ ∞ 2
2 ∞ 2

Varianza esperada: V [x ] = ∫ (x − x ) f(x ) dx = ∫ x f(x ) dx −  ∫ x f(x ) dx 
−∞ −∞  −∞ 
P i+1
a i+1 * ai
Moda esperada:
Mo = L i −1 + Mo = P i+1 * +
a i Li −1
P i+1 + P i −1 +
P i+1 P i −1
a i+1 a i −1
1
Me ∞
1 0.5 − Pac (x i −1 )
Mediana esperada: ∫ f (x) dx = ∫ f (x) dx = 2 −∞≤ x ≤∞ Me = Li −1 + (a i )
−∞ Me P(x i )

CALCULO DE PROBABILIDADES

n ij Casos favorables
Probabilidad conjunta: P ij = =
n Casos posibles
s
Probabilidad marginal:
n i1 n i2 n i3 n
P ( x i ) = ∑ P ( x i, y j ) = + + + . . . + is
j=1 n n n n
Regla de adición: P(x ∪ y) = P(x) + P(y) - P(x,y)
P (x , y )
Probabilidad condicional: P (x /y ) =
P (y )
Regla multiplicativa: P(x, y) = P(y) * P(x / y)
s
Probabilidad total: P (x ) = P (x, y1) + P (x, y 2) + P (x, y 3) + . . . + P (x, y s) = ∑ P (x, y j)
j=1

P (x i y j ) P (y j ) * P (x i / y j )
Teorema de Bayes: P (y j /x i ) = = s
P (x i )
Σ P (y j ) * P (x i / y j )
j=1

2
ÁRBOL DE DECISIÓN PARA ELEGIR LA DISTRIBUCIÓN ADECUADA
PARA LA RESOLUCIÓN DE PROBLEMAS

n>25
p<0.05 Poisson µ x e−µ
P(x, µ) =
independiente x!
Binomial
dicotómico (x ± 0.5) − np
n np>5 Aproximación Z =
P(x) =   p x q n − x npq
x nq>5 a la normal
fijo dependiente  N1   N − N1 
Hipergeométrica   
x n−x 
categoría P(x) =   
N
 
discreta n
n
variable independiente Multinomial n!
f (x1, x2,..., xK ) = n
* Π P (xi )xi
i=1
Πx! i
i=1

continua dicotómico Binomial *


independiente negativa B (n, c, p ) = 1 - B (x -1, n, p )

¿Tipo de
variable?
− ( x −µ )2
¿Número de 1 2 σ2 X −µ
Normal y= e −∞ ≤ x ≤ ∞ z=
ensayos? σ
¿Resultados
¿Naturaleza
2πσ
posibles? de las
pruebas?

3
ÁRBOL DE DECISIÓN PARA
LAS APLICACIONES DE LA DISTRIBUCIÓN NORMAL

No existe Aproximación (x ± 0.5) − np


Normal normal a la Z=
binomial npq
No

Discreta No existe Distribución


Normal normal
X−µ
z=
poblacional σ
No

Continua n σ
Cualquiera < 0.05 σx =
x −µ N n
Distribución z=
¿Tipo de Normal
de las medias σx
variable? muestrales
Si σ N −n
Grande µx = µ n σx =
≥ 0.05
N n N −1
¿Existen
muestras? No normal

¿Forma de la Pequeño No se puede aplicar el


población? teorema central del límite
¿Tamaño de
muestras?

4
ARBOL DE DECISIÓN PARA ESTIMACIÓN DE INTERVALOS

DE LA MEDIA DE LA POBLACIÓN

Utilice esta estimación por intervalo:

Cualquier n σ σ
Si P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n

Grande
s s
No n>30 P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n
Pequeño
s s
Normal n<30 P = (x - t α ,n − 1 * ≤ µ ≤ x+ tα ,n−1 * ) = 1 - α
2 n 2 n

Grande
σ σ
Si n>20 P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
No 2 n 2 n
Pequeño
Forma de la
n<20 σ σ 1
población P = (x - K ≤ µ ≤ x+ K ) =≥ 1 -
n n K2
Grande
No n>50 s s
P = (x - Zα * ≤ µ ≤ x + Zα * ) = 1 - α
2 n 2 n
¿Se conoce la varianza de la
Pequeño
población?
n<50
¿Tamaño de la
No hay estimación por intervalo general conocida.
muestra?

5
ÁRBOL DE DECISIÓN PARA EL CÁLCULO
DEL TAMAÑO DE MUESTRA
2
Infinito  σ
n0 =  zα 
No importa
 2 e

Finito
z 2σ 2 N
n=
z 2σ 2 + e 2 ( N − 1)

Si 2
Infinito  s
n0 =  z α 
 2 e
No z 2 s2 N
Finito n=
Media z 2 s 2 + e 2 ( N − 1)
No
2
 s
Infinito n0 =  t α ,n p −1 
Si  2 e

Finito
t 2s2 N
Proporción n=
t 2 s 2 + e 2 ( N − 1)
No importa
2
 zα 
¿Parámetro a Infinito n0 = pˆ (1 − pˆ )  2 
estimar? No importa  e 
¿Varianza  
conocida?
¿Tamaño de Finito pqz 2 N
n=
muestra piloto pqz 2 + e 2 ( N − 1)
conocido?
¿Tamaño de la
Población?

6
ARBOL DE DECISIÓN PARA ESTIMACIÓN DE INTERVALOS
DE LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES

Utilice esta estimación por intervalo:


No 2 2 2 2
σ1 σ2 σ1 σ2
Cualquier n No P ((x1 − x2 ) - z α * + ≤µ1 − µ2 ≤ (x1 − x2 ) + z α * + ) =1- α
2 n1 n2 2 n1 n2

2 2 2 2
No s1 s2 s1 s2
No P ((x1 − x2 ) - z α * + ≤µ1 − µ2 ≤ (x1 − x2 ) + z α * + ) =1- α
2 2
Grande n1 n2 n1 n2

Si s s
P (x − z α * ≤µ≤ x + z α * ) =1 - α
2 n 2 n
Si Si

Si s s
n>30 P (x − t α * ≤µ≤ x + t α * ) =1 - α
,ν n ,ν n
2 2

1 1 1 1
No Si P ((x1 − x2 ) - t α * s

+

≤µ1 − µ2 ≤ (x1 − x2 ) + t α *s + ) =1- α
2 2
n1 n2 n1 n2
Si
(n1 − 1) s12 + (n 2 − 1) s 22 ν = n1 + n2 − 2
¿Varianzas de s=
n<30 n1 + n 2 − 2
las poblaciones
conocidas? Pequeño No
2 2 2 2
s1 s2 s1 s2
¿Tamaño de las P ((x1 − x 2 ) − t α * + + ) =1- α

≤µ1 − µ2 ≤ (x1 − x 2 ) + t α *
No ,ν
¿Datos 2 2
muestras? n1 n2 n1 n2
pareados? 2
¿Varianzas  s12 s 22 
Iguales?  + 
n n2 
ν =  12 2
−2
2
 s1   s 22 
   
 n1  +  n 2 
n1 + 1 n 2 + 1
7
ÁRBOL DE DECISIÓN PARA ELEGIR EL INTERVALO DE CONFIANZA
ADECUADO EN LA RESOLUCIÓN DE PROBLEMAS

Media (Árbol de decisión)  


Promedio
Medio  
 s s
P <σ <  = 1−α
Variación  zα zα 
n>30 1+ 2 1− 2 
Variabilidad
Varianza  2n 2n 
 (n − 1) s 2 ( n − 1) s 2 
n<30 2
P 2 <σ < 2  = 1−α
Fracción  χ α , n−1 χ 1−α ,n −1 
Porcentaje  2 2 
Una Probabilidad
 pˆ (1 − pˆ ) pˆ (1 − pˆ ) 
Proporción < p < pˆ + zα
2 2
P  pˆ − zα  = 1 − α
 n n 
Comparación Diferencia de medias (Árbol de decisión)
Dos de promedios

¿Número de Relación de  s2 
variabilidades 1 1 σ 12 s12 1
poblaciones? Cociente de varianzas 
P 2 < <  = 1−α
 s2 Fα , n −1, n −1 σ 22 s22 F1−α ,n −1,n −1 
 2 1 2 2 1 2 
Comparación
de fracciones
o porcentajes
Diferencia
de proporciones
 pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) 
P  ( pˆ1 − pˆ 2 ) ± zα + < p1 − p2 < ...  = 1 − α
 2 
¿Cuál es la  n1 n2 
palabra clave?

8
ÁRBOL DE DECISIÓN PARA LA PRUEBA DE HIPÓTESIS
DE LA MEDIA DE LA POBLACIÓN

Utilice este estadístico de prueba:

Cualquier n x − µ0
Si Z=
σ n
Grande x − µ0
No n>30 Z=
s n
Pequeño
Normal n<30 x −µ0
t=
s n
Grande
x − µ0
Si n>20 Z=
No σ n
Pequeño
Forma de la x − µ0
n<20 K=
población σ n
Grande x − µ0
No n>50 Z=
s n
¿Se conoce la varianza de la
Pequeño
población? n<50 Callejón sin salida! No hay prueba de hipótesis
¿Tamaño de la conocida.
muestra?

9
ARBOL DE DECISIÓN PARA PRUEBAS DE HIPÓTESIS

DE LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES

Utilice este estadístico de prueba:


No (X1 − X2 ) − ( µ 1 − µ 2 )
Z=
Cualquier n No σ12 σ 22
+
n1 n 2

No (X 1 − X 2 ) − ( µ1 − µ 2 )
Z=
No s12 s 22
Grande +
n1 n 2
Si x − µ0
Z=
Si Si S n

Si x − µ0
n>30 t=
S n

No Si t=
(X 1 − X2 ) − (µ 1 − µ 2 )
s=
( n1 − 1) s12 + ( n2 − 1) s22
1 1 n1 + n2 − 2
Si S +
n1 n2 ν = n1 + n2 − 2
¿Varianzas de
n<30
las poblaciones
conocidas? Pequeño No 2
 s12 s22 
¿Tamaño de las  + 
No (X 1 − X2 ) − (µ 1 − µ 2 )
ν=  n1 n2  −2
¿Datos t= 2 2
muestras? 2 2  s12   s22 
pareados? S1 S 2    
¿Varianzas +  n1  +  n2 
n1 n2
Iguales? n1 + 1 n2 + 1

10
ÁRBOL DE DECISIÓN PARA ELEGIR LA PRUEBA DE HIPÓTESIS
ADECUADA EN LA RESOLUCIÓN DE PROBLEMAS

Media (Árbol de decisión)


Promedio
Medio ( n − 1) S2
2
χ =
Variación n<30 σ 20
Variabilidad
Varianza
S−σ
n>30 Z=
Fracción σ 2n
Porcentaje
Una Probabilidad
Proporción
X − np
Z=
np (1 − p )
Comparación Diferencia de medias (Árbol de decisión)
Dos de promedios

¿Número de Relación de
variabilidades s12
poblaciones? Cociente de varianzas F= 2
s2
Comparación
de fracciones
o porcentajes
Diferencia pˆ 1 − pˆ 2
Z=
de proporciones 1 1 
¿Cuál es la P (1 − P )  + 
palabra clave?  n1 n 2 

11
ANÁLISIS DE VARIANZA DE UN FACTOR

Fuente de Suma de Grados de Media cuadrada Razón F


variación cuadrados libertad
Entre SSTr k-1 SSTr MSTr
tratamientos MSTr = F=
k −1 MSE
Error SSE N-k SSE
muestral MSE =
N−k
Total SST N-1

El estadístico de prueba es la F de Fisher, puesto que se están relacionando dos varianzas. Las ecuaciones para hallar este valor
son:

k n
T2
SST = ∑∑ yij2 −
i =1 j=1 N
k 2 n
Ti2 T 2 2  k n 
SSTr = ∑ − donde: T =  ∑∑ y ij  Ti = ∑ yij
i =1 n i N  i =1 j=1  j=1

SSE = SST − SSTr

12
ANÁLISIS DE VARIANZA DE DOS FACTORES SIN INTERACCIÓN

Fuente de Suma de Grados de Media cuadrada Razón F


variación cuadrados libertad
Tratamientos SSTr a-1 SSTr MSTr
MSTr = FTr =
a −1 MSE
Bloques SSBl b-1 SSBl MSBl
MSBl = FBl =
b −1 MSE
Error muestral SSE (a-1)(b-1) SSE
MSE =
(a − 1)(b − 1)
Total SST ab-1

Donde existe un estadístico para las dos pruebas: Tratamientos y Bloques. Las ecuaciones necesarias son:

2
a b
T2 2 2
 a b 
SST = ∑∑ y − ij donde: T =  ∑ ∑ y ij 
i =1 j=1 ab  i =1 j =1 
a b
Ti2 T 2
SSTr = ∑ − donde: Ti = ∑ yij
i =1 b ab j=1

b a
Tj2 T2
SSBl = ∑ − donde: Tj = ∑ yij
j=1 a ab i =1

SSE = SST − SSTr − SSBl

13
ÁRBOL DE DECISIÓN PARA ELEGIR LA PRUEBA PARAMÉTRICA O NO, ADECUADA
EN LA RESOLUCIÓN DE PROBLEMAS
¿Clasificaciones 2
Independencia de r c
independientes? 2 (f ij − Eij )
atributos (NP) χ = ∑∑
Cualquier i =1 j =1 Eij
a ¿Bloques y ANOVA
tratamientos iguales?
(Dos factores) (P)
2
12  k ∑ R i 
Prueba H (NP) H=  ∑  − 3(N + 1)
Si N(N + 1)  i =1 n i 
¿Las medias son
iguales? n1 ( n1 + 1)
ANOVA U = n1n2 + − ∑ R1
Mayor a dos (Un factor) (P) 2
(Muestras n ( n + 1)
independientes) n<20 U ' = n1n2 + 2 2 − ∑ R2
2
Prueba U (NP)
¿Las medias son  n + n + 1
Dif. Medias (P) ∑R −∑R 1 2
− (n1 − n2 ) 1 2 
No iguales? n>20  2 
(Muestras z=
independientes)  n + n + 1 
n1n2  1 2 
¿Cuadro Dos  3 
bidimensional? Prueba de signos (NP)
¿Experimentos n<20 Distribución binomial
antes y después? Dif. Medias (P) (p=0.5)
(Muestras dependientes o
apareadas)
Una ¿Preferencia de (x ± 0.5) − 0.5n
n>20 z=
productos?
Prueba de signos (NP) 0.5 n
¿Número de
muestras?
k 2
¿Ajustar a una 2 ( Oi − ei )
distribución? Bondad de ajuste (NP) χ =∑
i =1 ei

14
FORMULARIO

ESTADÍSTICA II

15

You might also like