Professional Documents
Culture Documents
DISTRIBUCIÓN DE PROBABILIDADES
Variable Aleatoria es una función que asocia un número real, perfectamente definido, a
cada punto muestral. A veces las variables aleatorias (va) están ya implícitas en los puntos
muestrales.
Ejemplo 2: Sea el evento, lanzar una moneda 3 veces al aire. Si se representa la cara con c
y el sello con s, entonces el espacio muestral será:
Espacio Muestral = {ccc, ccs, csc, scc, css, scs, ssc, sss}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc) = 1/8, ya que la
probabilidad de sacar cara en una tirada es 1/2 según la definición clásica y las tiradas son
independientes.
Definimos la va X: número de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan
todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le
asigna la probabilidad del suceso correspondiente.
x Sucesos px
0 {zzz} 1/8
3 {ccc} 1/8
En el caso de las variables discretas, como en el ejemplo, es una función que para cada
valor de la variable da su probabilidad.
Ejemplo 3. Sea el evento experimental, lanzar al aire 2 monedas. Se sabe que el espacio
muestral de este experimento contiene 4 puntos muestra les.
Una variable X es una variable aleatoria si es una magnitud susceptible de tomar diversos
valores con determinadas probabilidades. Es una regla que asocia un número con cada
evento simple en el espacio muestra de un experimento. Por lo general, esta regla se
simboliza por medio de las mayúsculas X, Y o Z.
Definición
Una variable aleatoria es una función que asocia un número real a cada elemento
del espacio muestral.
O también,
Una Variable Aleatoria es una función que asigna un número real a cada resultado
en el espacio muestral de un experimento aleatorio.
Definición
3 .... f x (x k ) 1
x
S = (Espacio Muestral) = {HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM}
Si lo que interesa es sólo el número de hembras que alumbra la mujer, entonces se podría
asignar un valor numérico de 0, 1, 2 ó 3 a cada uno de los puntos muestrales.
Los números 0, 1, 2 y 3 son cantidades aleatorias que se determinan a través del resultado
del experimento. Se podría pensar como los valores que toma alguna variable aleatoria X,
que en este caso representa el número hembras que nacen cuando la mujer tiene 3
alumbramientos.
Definición
Las variables aleatorias discretas representan datos que se refieren, tales como el número
de artículos defectuosos en una muestra de m de ellos o el número de accidentes en
carreteras por año en un estado determinado.
Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede
salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32.
Definición
Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro
de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida
de una población (72,5 años, 7,513 años, 72, 51234 años).
Con frecuencia, los valores posibles de una variable aleatoria continua son precisamente los
mismos valores contenidos en el espacio muestral continuo. Tal es el caso de aquella
variable aleatoria que representa la distancia que cierta marca de automóvil puede recorrer,
en un camino de prueba, con 5 litros de gasolina. En la mayoría de los problemas prácticos,
las variables aleatorias continuas representan datos medidos, tales como alturas, pesos,
temperaturas, distancias o períodos de vida posibles.
Se puede especular en una variable aleatoria como un valor o una magnitud que cambia de
un desarrollo a otra, sin seguir una secuencia predecible. Por ejemplo, en un hospital para
tratamiento del cáncer de pulmón no se tiene manera de saber con exactitud cuántos
hombres van a ser atendidas en un día cualquiera. Si los registros diarios del hospital
indican que los valores de la variable aleatoria van desde 100 hasta 115 pacientes diarios,
entonces ésta es una variable aleatoria discreta.
Una variable aleatoria es discreta cuando únicamente puede tomar un determinado número
de valores en un intervalo. Por ejemplo, la variable aleatoria N° de caras obtenidas al
lanzar 2 monedas, es una variable aleatoria discreta en el intervalo (0,2). Solo puede tomar
los valores 0, 1 y 2. Si el espacio muestral consiste en un Conjunto discontinuo de sucesos,
entonces una variable asociada con ese conjunto se le llama discreta; de otra manera, se le
llama continua.
Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo.
Supongamos el experimento de lanzar una moneda hacia una línea marcada en el suelo.
Supongamos que la distancia máxima a que puede caer la moneda de la marca es 1 metro
(entendiendo como distancia la del centro de la moneda a la línea). Si definimos una
Distribuciones de Probabilidad
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS
Para una variable aleatoria discreta, se pueden enumerar todos los valores numéricos
posibles de la variable en una tabla con las probabilidades correspondientes. Existen
diversas distribuciones estándar de probabilidad que pueden utilizarse como modelos para
una amplia gama de variables aleatorias discretas en aplicaciones de negocios.
Para una variable aleatoria continua no es posible enumerar todos los posibles valores
fraccionarios de la variable y, por lo tanto, las probabilidades que se determinan a través de
una función matemática se ilustran en forma gráfica mediante una función de densidad de
probabilidad o curva de probabilidad.
Valor
Demandas Posibles Número de Días Probabilidad P ( X ) Ponderado X . P ( X )
X
3 3 0.06 0.18
4 7 0.14 0.56
5 12 0.24 1.20
6 14 0.28 1.68
7 10 0.20 1.40
8 4 0.08 0.64
TOTALES 50 1.00 E ( X ) 5 . 66
Las variables aleatorias, son aquellas que se relacionan con la ocurrencia de un fenómeno
aleatorio. Cuando una de esas variables aleatorias toma diversos valores, la probabilidad
asociada a cada uno de tales valores puede ser organizada como una distribución de
probabilidad, lo que se denomina distribución de las probabilidades asociadas a cada uno
de los valores de la variable aleatoria. Las distribuciones de probabilidad logran
representarse a través de una tabla, una gráfica o una fórmula, en cuyo caso tal regla de
correspondencia se le denomina función de probabilidad.
Una variable aleatoria discreta adquiere cada uno de sus valores con cierta probabilidad. En
el proceso del lanzamiento de una moneda 3 veces, la variable X, que representa el número
de sellos, toma el valor 2 con una probabilidad de 3/8, puesto que 3 de los puntos
muestrales igualmente probables dan como resultado 2 sellos y 1 cara. Si se suponen
arreglos iguales para los eventos simples del siguiente ejemplo:
b 3 1 1 0 0 1
Espacio Muestral SJB SBJ JSB JBS BSJ BJS
La probabilidad de que ningún obrero reciba de nuevo la herramienta que tenía, es decir,
la probabilidad de que B tome el valor de cero, es 1/3. Los posibles valores b de B y sus
probabilidades están dados por
b 0 1 3
1 1 1
P(B = b) 3 2 6
Definición
1. f ( x ) 0.
2. f ( x) 1.
3 . P ( X x ) f ( x ).
Solución.- Sea X una variable aleatoria cuyos valores de x son los números posibles de
computadoras defectuosas adquiridas por el comerciante. Luego, x puede se cualquiera de
los números 0, 1 y 2. Entonces:
3 5 3 5
0 2 10 1 1 15
f (0) P (X 0) ,.. f (1) P ( X 1) ,..
8 28 8 28
2 2
3 5
2 0 3
.f ( 2 ) P ( X 2 )
8 28
2
X 0 1 2
2
P(X=x) ¼ /4 ¼
Se alcanzará explicar por qué se usa el nombre "distribución de probabilidad". Con esta
información se puede construir un histograma como el siguiente:
SOLUCIÓN: Si asumimos que todos los resultados observados al lanzar los dos dados son
equiprobables (si todos los sucesos elementales que lo integran tienen la misma
probabilidad) entonces el espacio muestral del experimento, con treinta y seis posibles
resultados, se presentan a continuación:
1 2 3 4 5 6
1 1,1 2,1 3,1 4,1 5,1 6,1
2 1,2 2,2 3,2 4,2 5,2 6,2
3 1,3 2,3 3,3 4,3 5,3 6,3
4 1,4 2,4 3,4 4,4 5,4 6,4
5 1,5 2,5 3,5 4,5 5,5 6,5
6 1,6 2,6 3,6 4,6 5,6 6,6
Como nos interesa la suma de los puntos observados, si obtenemos el resultado (3, 5) le
asignamos el valor 8, correspondiente a la suma de 3 y 5. Podemos calcular la probabilidad
de que la suma sea igual a 8, contando todos los resultados donde la suma es ocho. El
evento de que la suma es ocho contiene 5 resultados: {(2,6), (3,5), (4,4), (5, 3), (6,2)}; por
lo tanto la probabilidad deseada es 5/36. Podemos repetir este proceso con cada uno de los
resultados para obtener las siguientes sumas probables al lanzar dos de acuerdo con la
tabla 2.
Sumas 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
Probabilidades
36 36 36 36 36 36 36 36 36 36 36
En este caso la variable X puede asumir un valor entre un conjunto finito de valores
posibles. Cualquier variable que pueda asumir un número finito de valores decimos es una
variable aleatoria discreta. También son variables aleatorias discretas aquellas que
pueden asumir un número muy grande o infinito de valores que potencialmente podrían ser
contados, tal como el número de habitantes del planeta, el número de granos de maíz
producidos en el planeta en una fecha determinada, el número de los árboles de un país.
x 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
f(x) 36 36 36 36 36 36 36 36 36 36 36
Vemos que f(x) nunca adquiere un valor menor de cero. Esto se debe a que f(x) representa
una probabilidad, la cual nunca puede ser menor de cero. De igual manera f(x) nunca puede
ser menor de 1. Si sumamos todos lo valores que puede tener f(x) obtenemos 1, debido a
que estamos sumando las probabilidades de que la variable aleatoria asuma uno de los
0,18
0,16
0,14
0,12
Probabilidades
0,1
0,08
0,06
0,04
0,02
0
1 2 3 4 5 6 7 8 9 10 11 12
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P(X
4). Vemos que P(X 4) = P(X =2 ó X =3 ó X =4) = P(X = 2) + P(X = 3) + P(X = 4) , ya
que los eventos donde X = 2, X = 3 y X = 4 son disjuntos. Entonces P(X 4) = 1/36 + 2/36
+ 3/36 = 6/36, sumando las áreas de la barras que están sobre el 4 y a su izquierda.
Debemos ser muy cuidadosos con las desigualdades, ya que P(X 4) = 6/36, mientras que
P(X< 4) = 3/26.
a) Todos los valores de la distribución son mayores o iguales que cero, y además son
menores o iguales que uno.
0 ≤ P(X=x) ≤ 1.
f ( x ) P(X=x) = 1.
De donde se puede afirmar que: la suma de todas las probabilidades de los eventos posibles
de una variable aleatoria es igual a la unidad. Hay que recalcar que estas propiedades se
enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad esto no
ocurre, es decir, que no sabemos la probabilidad y lo que se hace es trabajar con
estimaciones. Se puede observar que en ningún caso las combinaciones toma valores
La que más nos interesará de estas será la distribución binomial que explicaremos
posteriormente.
la fórmula,
xf , donde, ( ) es la media de la población, la cual puede expresarse
n
f
como X
n
.
x .P ( x )
X 0 1 2
2
P(X=x) ¼ /4 ¼
2
1 1 1
xP ( x ) 0 . 4 1 . 2 2 . 4 1
x0
f (x )
2
f
(x)
2 2
n
(x)
2
P( x )
2 1 2 1 2 1 1 1 1 1 1 1 2
( 0 1) (1 1) ( 2 1) 1. 0. 1. .
4 2 4 4 2 4 4 4 2 2
Esta medida de resumen se puede obtener multiplicando cada resultado posible Xi por su
probabilidad correspondiente P ( X i ) y después sumando los productos resultantes. Por
lo tanto el valor esperado de la variable aleatoria discreta X, representada como E ( X ) ,
se puede expresar con la siguiente formula matemática:
x E(X ) X i P ( X i ) , donde:
i 1
Xi = Resultado i de X.
i= 1, 2, 3, ....,N.
x E(X ) xf x
( x) o x E(X ) X iP(X i ) .
x i 1
La media de X puede interpretarse como el centro de la masa del rango de los valores de X.
Esto es, si se coloca una masa igual a f x ( x ) en cada punto x de la recta real, entonces
E(X) es el punto donde la recta queda en equilibrio. Por consiguiente, el término función de
probabilidad puede interpretarse mediante esta analogía con la mecánica.
Si se tiran dos monedas al aire 16 veces y X representa el número de caras que ocurren por
lanzamiento, entonces los valores d e X pueden ser 0, 1 y 2. Supóngase que en el
experimento se obtienen cero caras 4 veces, una cara 7 veces y dos caras 5 veces. El
promedio de caras por lanzamiento de las dos monedas es entonces
( 0 )( 4 ) (1)( 7 ) ( 2 )( 5 )
1 . 06 .
16
Reestructúrese ahora el cálculo para el número promedio de caras resultantes, de modo que
tenga la siguiente forma equivalente
Los números 4/16, 7/16 y 5/16 son las fracciones del total de lanzamientos que resulta en 0,
1 y 2 caras, respectivamente. Estas fracciones son también las frecuencias relativas que
corresponden a los diferentes valores de X en el experimento. En efecto, se puede calcular
entonces la media o el promedio de un conjunto de datos, si se conocen los distintos valores
que intervienen y sus frecuencias relativas, sin conocimiento alguno del número total de
observaciones en el conjunto de datos. Por consiguiente, si 4/16 ó 1/4 de los lanzamientos
resultan 0 caras; 7/16, una cara; y 5/16, dos caras, el número medio de caras por
lanzamiento seria 1.06, sin importar que el número total de lanzamientos sea de 16, 1 000 o
aun de 10 000.
Utilícese ahora este método de las frecuencias relativas para calcular a la larga el número
promedio de caras por lanzamiento de dos monedas que podría esperarse.
Suponiendo que se tiran al aire dos monedas normales, se tiene que el espacio
muestra1 para el experimento es
Puesto que los 4 puntos muestrales son igualmente probables, se deduce que
P(X = 0) = P(SS) = 1 .
4
P(X = 2) = P(HH) = 1 .
4
Esto significa que una persona que tira al aire 2 monedas una y otra vez, logrará en
promedio 1 cara por tirada.
EL método descrito para calcular el número esperado de caras en cada tirada de 2 monedas,
indica que la media o valor esperado de una variable aleatoria discreta puede obtenerse
multiplicando cada uno de los valores x 1 , x 2 ,..., x n , de la variable aleatoria X por su
probabilidad correspondiente f ( x 1 ), f ( x 2 ),....., f ( x n ), y sumando luego los resultados.
Sin embargo, esto se verifica sólo si la variable aleatoria es discreta. En el caso de variables
aleatorias continuas, la definición del valor esperado es en esencia la misma, sólo que las
sumatorias se reemplazan por integrales.
4 3
x 3 x
f(x) , para x = 0, 1, 2, 3.
7
3
1 12 18 4 60 12
E ( X ) 0 1 2 3 1 . 70 .
35 35 35 35 35 7
Por lo tanto, si se selecciona al azar una y otra vez un comité de 3 miembros a partir de un
grupo de 4 químicos y 3 biólogos, el mismo contendría en promedio 1.7 químicos.
Solución. El espacio muestral formado por todos los posibles resultados que pueden
obtenerse cuando se lanzan 3 monedas de manera simultánea, o en forma equivalente si la
moneda se lanzan 3 veces sucesivamente (C = cara, S = sello), es
S = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}. Se puede argumentar que cada una
de estas posibilidades es igualmente posibles y ocurre con una probabilidad igual a 1/8. Un
enfoque alternativo seria aplicar la regla multiplicativa de probabilidad para sucesos
independientes con cada uno de los elementos del espacio muestral (S), así:
1 1 1 1
P ( CCS ) P ( C ) P ( C ) P ( S ) . Recuerde que la probabilidad de salir cara es
2 2 2 8
igual ala de salir sello, es decir, ½.
La variable aleatoria de interés es X, que es la cantidad que el jugador puede ganar; y los
valores posibles de X 5 $ si ocurre el evento E 1 CCC , SSS y - 3 $ si ocurre el
1 3
E ( X ) 5 3 1 .
4 4
Por lo tanto en este juego el apostador, en promedio, perderá 1 $ al lanzar las 3 monedas.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una
presentación a otra, sin seguir una secuencia predecible. Por ejemplo, en una clínica para
tratamiento del cáncer de mamas no se tiene manera de saber con exactitud cuántas mujeres
van a ser atendidas en un día cualquiera. De modo que el número de pacientes del día
siguiente es una variable aleatoria. Los valores de una variable aleatoria son los valores
numéricos correspondientes a cada posible resultado del experimento aleatorio. Si los
registros diarios de la clínica indican que los valores de la variable aleatoria van desde 100
hasta 115 pacientes diarios, entonces ésta es una variable aleatoria discreta.
En la tabla B se ilustra el número de veces que se ha alcanzado cada nivel durante los
últimos l00 días. Observe que en la tabla aparece una distribución de frecuencias. Hasta
donde creamos que la experiencia de los pasados 100 días es un comportamiento típico,
podemos utilizar este registro para asignar una probabilidad a cada número posible de
pacientes y encontrar una distribución de probabilidad. Hemos hecho esto en la tabla B
mediante la normalización de la distribución de frecuencias observadas (en este caso, di-
vidimos cada valor que aparece en la columna de las frecuencias (fi) de la tabla B , el
número total de días en que se tomaron los registros (número atendido). La distribución de
probabilidad para la variable aleatoria “número de atenciones diarias” se presenta de
manera gráfica en la figura I. Note que la distribución de probabilidad para una variable
aleatoria proporciona una probabilidad para cada valor posible y que estas probabilidades
deben sumar 1. De la misma forma en esa tabla se registra el valor esperado o esperanza
matemática que es simplemente la multiplicación de los valores posibles de la variable
aleatoria por la probabilidad de que la variable aleatoria tome esos valores. En la tabla B
mostramos que ambos requisitos se cumplen. Además, tanto la tabla B como la figura I nos
dan información acerca de la frecuencia de presentación a la larga del número de pacientes
atendidos diariamente que esperaríamos observar si este “experimento” aleatorio se
efectuara de nuevo.
TABLA B
0,12
0,1
PR O B A B IL ID A D
0,08
0,06
0,04
0,02
0
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
10
10
10
10
10
10
10
10
10
10
10
11
11
11
11
11
11
Nú m e r o s d iar io s d e m u je r e s at e n d id as
Si un agente de seguros afirma que puede esperarse que una mujer de 45 años de edad
viva otros 33 años, esto no significa que cualquier persona espere realmente que una mujer
de 45 años siga viviendo hasta cumplir los 78 años y muera al día siguiente. En lo
concerniente a esa afirmación, ciertas mujeres de 45 años vivirán 12 años más, otras
sobrevivirán 25 años, otras vivirán 38 años más, . . . , y la expectativa de vida de “33 años
más” se debe interpretar como una especie de promedio particular, llamado valor esperado
o esperanza matemática. Originalmente, el concepto de la esperanza matemática apareció
en relación con juegos de azar y, en su forma más simple, se determina con el producto de
la cantidad que un jugador deposita para ganar y la probabilidad de que gane dicha
cantidad.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si apostamos para ganar 500 pesos, si
y sólo si sale cara, al lanzar al aire una moneda equilibrada?
SOLUCIÓN: La moneda está equilibrada, de manera que la probabilidad de que salga cara
es ½, entonces nuestra esperanza matemática es 500x0.5 = 250 pesos.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si compramos uno de los 1000 boletos
de una rifa, en la que se ofrece como premio un televisor a color, que vale 480000 pesos?
1 480000
480000x 480 , es decir, 480 pesos. Por lo tanto, en un sentido
1000 1000
estrictamente monetario, seria irracional pagar más de 480 pesos por el boleto.
PROBLEMA. Sean 0.24, 0.35, 0.29 y 0.12 las probabilidades de que un usurero pueda
vender en un año un lote subdividido, con las respectivas ganancias de Bs.1250000, Bs.
800000 o de Bs. 100000 o con una pérdida de Bs. 250000. ¿Cuál es la utilidad o ganancia
esperada?
SOLUCIÓN: Si se sustituye
P1 0 . 24 ,.. P2 0 . 35 ,.. P3 0 . 25 .. y .. P4 0 . 12 .
x E(X ) X iP(X i ) .
i 1
x 3 x
3 1 3
f ( x ) , x 0 ,1, 2, 3. Encuentre la esperanza matemática.
x 4 4
0 3 2 2
3 1 3 27 3 1 3 27 3 1 3 9
f (0 ) ,... f (1) ,.. f ( 2 )
0 4 4 64 1 4 4 64 2 4 4 64
3 0
3 1 3 1
f (3)
3 4 4 64
x 0 1 2 3
27 27 9 1
f ( x) 64 64 64 64
27 27 9 1 27 ( 2 ) 9 ( 3 )1 48 3
E 0 1 2 3 0 . 75 .
64 64 64 64 64 64 4
LA DISTRIBUCIÓN BINOMIAL
El nombre que recibe esta distribución se debe a la similitud existente entre la distribución
de las probabilidades de obtener 0, 1, 2, 3,…..elementos considerados como “éxito” de
una muestra de tamaño n, y los términos sucesivos del desarrollo binomial ( p q ) n ,
donde p expresa la probabilidad de éxito de un solo ensayo (situación experimental), y q
es la probabilidad de “fracaso” (tal que, p + q = 1). En este caso, éxito significa
encontrarse con cierta clase de evento, mientras que fracaso significa no encontrarse con
dicho evento. En esta guía se hará un breve reposo del Teorema del binomio o Binomio
En términos generales, el teorema del binomio establece que para a, bR y nN, se
tiene que:
n
n n n n 1 n n 1 n n n n i i
n
( a b ) a a b .... ab b a b .
0 1 n 1 n i 1 i
n x n x
Px . p q .
x
La probabilidad Px de que un evento se presente POR LO MENOS x veces en n
intentos esta expresada por la ecuación:
xn xx
n x n x
Px . p q
.
xx
xx
x
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 56 7028 56 28 8 1
1 9 36 84 126 126 84 36 9 1
1 10 45 120 210 252 210 120 45 10 1
6 6 5 4 2 3 3 2 4 5 6
( x y ) x 6 x y 15 x y 20 x y 15 x y 5 xy y .
2.- Cada ensayo proporciona un resultado que puede clasificarse como éxito o fracaso.
Cuando es éxito la variable toma el valor 1 y cuando es fracaso toma el valor 0.
EJEMPLOS 1: La Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no
sale); la probabilidad de ser admitido en una universidad (o te admiten o no te admiten); la
probabilidad de acertar un Kino (o aciertas o no aciertas).
Verificándose que:
p + q = 1.
EJEMPLOS 2: Probabilidad de salir cara al lanzar una moneda al aire:
p + q = 0,5 + 0,5 = 1.
p + q = 0,25 + 0,75 = 1.
p + q = 0,00001 + 0,99999 = 1.
3. La posibilidad de que cada muestra de aire contenga una molécula rara es 10%. Sea X
= número de muestras de aire que contienen la molécula rara en las siguientes 18 muestras
por analizar.
5. Un examen de opción múltiple contiene diez preguntas, cada una con cuatro opciones, y
se pide a una persona que adivine las respuestas. Sea X = número de respuestas
contestadas de manera correcta.
Estos ejemplos dejan entrever la utilidad de un modelo de probabilidad general que incluya
estos experimentos como casos particulares.
Cada uno de estos experimentos aleatorios pueden considerarse corno formado por una
serie de ensayos repetidos; 10 lanzamientos de la moneda en el experimento (1), la
producción de 25 partes en el experimento (2) y así sucesivamente. En cada caso, la
Los términos éxito y fracaso son solo etiquetas. También pueden utilizarse para este fin
“A” “B” o “0” y "1". Por desgracia, en ocasiones las etiquetas usuales pueden ser
engañosas. En el experimento (2), dado que X es el número de partes defectuosas, la
producción de éstas es un éxito.
A menudo es razonable suponer que los ensayos que forman el experimento aleatorio son
independientes. Esto implica que el resultado de uno de los ensayos no tiene ningún efecto
sobre el resultado que se obtenga en cualquier otro ensayo. En el experimento (2), la
hipótesis de ensayos independientes implica saber que la parte número 5 es defectuosa, no
tiene ningún efecto sobre la probabilidad de que cualquiera de las demás partes sea
defectuosa. Asimismo, a menudo es razonable suponer que la probabilidad de éxito en
cada ensayo es constante. En el experimento de opción múltiple [experimento (5)], si se
supone que el sujeto que lleva a cabo la prueba no tiene ningún conocimiento del tema y
sólo adivina la respuesta de cada pregunta, entonces puede considerarse que la probabilidad
de una respuesta correcta para cada pregunta es 1/4.
4 1 4 3 4 9 64 .
P ( NDN ) P ( N ) P ( D ) P ( N ) 3
P ( X x ) f ( x ) b ( x .;.. n ;.. p ),
Generalizando la igualad anterior con el objeto de obtener una formula matemática para
b(x, n, p), que proporcione la probabilidad de x éxitos en n ensayos en el caso de un
experimento binomial. Primeramente se considerará la probabilidad de x éxitos y de n – x
fracasos en un orden especificado. Tomando en cuenta que los ensayos son independientes,
se pueden multiplicar todas las probabilidades correspondientes a los diferentes resultados.
Cada éxito ocurre con una probabilidad p y cada fracaso, con una probabilidad q = 1 – p.
En consecuencia, la probabilidad para un determinado pedido (del problema anterior) es
x n x
p q . Se debe determinar ahora el número total de puntos maestrales en el experimento
que tiene x éxitos y n – x fracasos. Este número es igual al número de particiones de n
resultados en dos grupos, con x en un grupo y n – x en el otro, el cual esta determinado
n n!
por C ( n ,x ) C xn = (n! se lee factorial de n, donde por definición factorial
x x ! ( n x )!
de cero es igual 1). Como esas particiones son mutuamente excluyentes, se suman las
probabilidades de todas las particiones diferentes para obtener la formula general o se
n
multiplica p x q n x por .
x
n x n x
b( x , n , p ) f ( x ) . p q ,.... x 0 ,1 ,2 ,3 ......, n
x
0 3 1 2
3 1 3 27 3 1 3 27
f ( 0 ) ..., f ( 1 )
0 4 4 64 1 4 4 64
2 1 3 0
3 1 3 9 3 1 3 1
f ( 2 ) ..., f ( 3 )
2 4 4 64 3 4 4 64
x 0 1 2 3
f(x) f ( x ) 27 27 9 1
64 64 64 64
En este experimento se indica con E un bit erróneo, y con C un bit sin error, esto es,
recibido correctamente. Con esto, el espacio muestral de este experimento puede
describirse como una lista de cuatro letras que indican qué bits fueron recibidos con y sin
error. Por ejemplo, el resultado CECE indica que el segundo y el cuarto bit son erróneos, y
los otros dos se recibieron correctamente. Por consiguiente, el espacio muestral es:
Resultado x Resultado x
CCCC 0 ECCC 1
CCCE 1 ECCE 2
CCEC 1 ECEC 2
CCEE 2 ECEE 3
CECC 1 EECC 2
Jesús Sachahuamán Flores Página 31
CECE 2 EECE 3
CEEC 2 EEEC 3
CEEE 3 EEEE 4
Por otra parte, la probabilidad de que se presente cualquiera de los seis resultados
mutuamente excluyentes para los que X = 2, es la misma. Por consiguiente:
En general,
P(X = x) =f(x)= (número de resultados con x errores) multiplicados por (0.1)x (0.9)4-x
Para ultimar una fórmula general de probabilidad, únicamente es preciso una expresión
para el número de resultados que contienen x errores. Puede construirse un resultado que
contiene x errores separando los cuatro ensayos en dos grupos. El tamaño de uno de los
grupos es x y contiene los errores, mientras que el tamaño del otro grupo es n-x y está
formado por los ensayos donde no hay errores. Tomando en cuenta la ecuación de
Combinación, el número de maneras de separar cuatro objetos en dos grupos, uno de los
cuales tiene tamaño x, es:
4 4!
. Por tanto, en este ejemplo,
x x ! ( n x )!
P ( X 2 ) f ( 2 ) 0 . 0486 .
Otros ejemplo:
Por ejemplo: Consideremos un examen con tres preguntas de opción múltiple, con cuatro
opciones, y que será contestado al azar.
Con los datos de esta prueba contamos con un experimento binomial, ya que la
probabilidad de éxito permanece constante en las tres preguntas (p = ¼) y las respuestas de
Tenemos ahora la variable aleatoria X del ejemplo anterior que representará el número de
respuestas correctas, siendo sus posibles valores: 0, 1, 2, y 3.
81
P(X=1) = P[(E1 F2 F3) (F1 E2 F3) = /256 = 3·(3/4)2·(1/4)1
(F1 F2 E3)]
9
P(X=2) = P[(E1 E2 F3) (E1 F2 E3) = /64 = 3·(3/4)1·(1/4)2
(F1 E2 E3)]
X P(X=x)
0 0.422
1 0.422
2 0.141
3 0.016
a.- ¿Cuál es la probabilidad de que en exactamente 2 de las 4 familias los maridos ejerza
una influencia decisiva en la selección de la marca del automóvil a comprar?
b.- ¿Cuál es la probabilidad de que los maridos ejerzan una influencia decisiva en la
selección de la marca del automóvil en por lo menos 2 de las 4 familias?
c.- ¿Cuál es la probabilidad de que los maridos seleccionen la marca del automóvil en las 4
familias?
SOLUCIÓN: Se supone que las decisiones de compras de las familias son independiente
y que p permanece constante de una familia a otra, por lo tanto, n = 4, y p = 0.7. Sea x el
número de familias en las cuales los maridos ejercen una influencia decisiva en la selección
de un automóvil nuevo. Por consiguiente, x = 0, 1, 2, 3 y 4, entonces se tiene que:
4
b ( x ,4 ,0 . 7 ) f ( x ) 0 . 70 0 . 30
x n x
,... x 0 ..,1 .., 2 ..,3 .., 4
x
4 2 2
a ). P ( exactament e ..dos ) P ( x 2 ) f ( 2 ) .( 0 . 70 ) ( 0 . 30 )
2
4!
( 0 . 49 )( 0 . 09 ) 0 . 2646
2 !. 2 !
4 0 4 4 1
1 C 0 ( 0 .7 ) ( 0 .3 ) C 1 ( 0 .7 ) ( 0 .3 )
3
1 0 . 0081 0 . 0756 1 0 . 0837
1 0 . 0837 0 . 9163
PROBLEMA: Con el propósito de decidir si se aceptan los lotes de mercancía que envía
la fabrica RANICA a un comerciante, se lleva acabo un procedimiento que consiste en
seleccionar 10 artículos al azar de cada lote y determinar el número que presenta defectos.
Un lote se rechaza siempre que se encuentren 2 o más artículos defectuosos entre los 10
seleccionados. Se supone que el número de artículos en cada lote es grande y que cada lote
contiene un 5 % de artículos defectuosos. ¿Cuál es la probabilidad de aceptar un lote de
artículos? ¿Cuál es la probabilidad de rechazarlo?
10 x 10 x
p ( x ) f ( x ) .( 0 . 05 ) ( 0 . 95 ) , entonces las probabilidades de aceptar un lote
x
es:
10
10
x 10 x
b ). P ( rechazar ) .( 0 . 05 ) ( 0 . 95 )
x2 x
El estudiante debe realizar la parte 2 de la P ( acetar ) y el resultado tiene que ser igual al
obtenido en la parte 1, (0.914). De la misma forma debe realizar los cálculos de la parte b y
el resultado tiene que ser igual al de la parte a (0.086).
El cálculo de p(x) puede ser muy aburrido cuando los valores de n son muy grandes. Por
tal razón, es conveniente describir la distribución de probabilidad binomial mediante se
media y su desviación estándar. Esto permitirá identificar valores de x que son altamente
improbables, usando el conocimiento sobre el teorema de Tchebysheff y la regla empírica.
Por lo tanto, es de gran importancia conocer el valor esperado o esperanza matemática y la
varianza de la variable aleatoria binomial x.
E ( x ) np
2
npq
npq
Cuando el espacio muestral de una variable aleatoria es un intervalo real decimos que la
variable es continua. La matemática que utilizamos para las variables continuas es diferente
a la de las discretas aunque los conceptos probabilísticos sean los mismos de manera que en
nuestro estudio de las continuas utilizaremos este paralelo con las discretas.
FUNCIÓN DE DENSIDAD
Una función y=f(x) es una función de densidad de una variable aleatoria continua si
cumple las siguientes condiciones:
Para calcular la probabilidad de que X esté en un intervalo (a, b) o (a, b] o [a, b) o [a, b] o
cualquier otro intervalo, debemos hacer uso de una función asociada a la variable aleatoria,
la función de densidad de X. Las variables aleatorias discretas tienen la función de
probabilidad, las continuas tienen función de densidad. Además, como en el caso discreto,
la función de densidad está ligada a la va X de modo que cuando sea necesario aclarar a
Por analogía con las definiciones de estos conceptos para variables aleatorias discretas, se
definen la esperanza matemática o media , la varianza y la desviación típica de una
variable aleatoria continua de la siguiente forma:
X
Si X es una variable aleatoria de media y desviación típica , la variable Z
tiene de media 0 y de desviación típica 1, y se llama tipificada de X. Podemos decir que
mide la desviación de X respecto de su media, tomando como unidad la desviación típica
de X.
Distribución normal
También se llama distribución de Gauss o distribución de Laplace-Gauss. Ello se debe a
que el matemático francés Pierre Simon de Laplace (v.), fue el primero que demostró la
siguiente relación, muy importante en el estudio de la distribución normal:
x
2
e
Cuando Gauss tenía diez años de edad, su maestro solicitó a la clase que encontrará la suma
de todos los números comprendidos entre uno y cien. El maestro, pensando que con ello la
clase estaría ocupada algún tiempo, quedó asombrado cuando Gauss, levantó en seguida la
mano y dio la respuesta correcta. Gauss reveló que encontró la solución usando el álgebra,
el maestro se dio cuenta de que el niño era una promesa en las matemáticas. Hijo de un
humilde albañil, Gauss dio señales dio señales de ser un genio antes de que cumpliera los
tres años. A esa edad aprendió a leer y hacer cálculos aritméticos mentales con tanta
habilidad que descubrió un error en los cálculos que hizo su padre para pagar unos sueldos.
Ingresó a la escuela primaria antes de que cumpliera los siete años. Cuando tenía doce años,
criticó los fundamentos de la geometría euclidiana; a los trece le interesaba las
posibilidades de la geometría no euclidiana. A los quince, entendía la convergencia y probó
el binomio de Newton. El genio y la precocidad de Gauss llamaron la atención del duque de
Brunswick, quien dispuso, cuando el muchacho tenía catorce años, costear tanto su
educación secundaria como universitaria. Gauss, a quien también le interesaban los clásicos
y los idiomas, pensaba que haría de la filosofía la obra de su vida, pero las matemáticas
resultaron ser una atracción irresistible.
A la edad de setenta y siete años, Gauss falleció. Se ha dicho que la lápida que señala su
tumba fue escrita con un diagrama, que construyó el mismo Gauss, de un polígono de
diecisiete lados. Durante su vida, se reconoció que era el matemático más grande de los
siglos XVIII y XIX. Su obra en las matemáticas contribuyó a formar una base para
encontrar la solución de problemas complicadísimos de las ciencias físicas y naturales.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n, p), para un mismo
valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se
aproximan a una curva en "forma de campana".
Sir Francis Galton construyó un ingenioso dispositivo que permitía obtener de forma
experimental la curva de distribución normal. La mayoría de las magnitudes, incluida la
inteligencia, se distribuyen siguiendo esta ley normal, que matemáticamente viene
expresada por la función:
2
es la varianza de la variable aleatoria
Dicha curva y tal como vemos en la gráfica, presenta un apiñamiento de frecuencias altas
en torno a la media, que se alejan de la misma a medida que ganan en singularidad.La
medida de la distancia al valor central es indicado por la desviación tipo o estándar.
La distribución normal queda definida por dos parámetros, su media y su desviación típica
y la representamos así
N ( , )
Para cada valor de y se tendrá una función de densidad diferente, por lo tanto la
expresión N ( , ) representa una familia de distribuciones normales.
2.- La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre
y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1.
3.- Es simétrica con respecto a su media . Según esto, para este tipo de variables
existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50%
de observar un dato menor.
7.- Como se deduce de este último apartado, no existe una única distribución normal,
sino una familia de distribuciones con una forma común, diferenciadas por los valores
de su media y su varianza. De entre todas ellas, la más utilizada es la distribución
normal estándar, que corresponde a una distribución de media 0 y varianza 1.
8.- Ql y Q3 están situados a 2/3 de una desviación estándar. El 68 % del área de la curva
(probabilidad) se encuentra a una desviación estándar de la media.
9.- La variable tiene un alcance infinito, pero la mayor parte del área bajo la curva se
encuentra a tres desviaciones estándar de la media.
FUNCIÓN DE DISTRIBUCIÓN
Puesto que hay un número infinito de combinaciones para los dos parámetros, hay un
número infinito de curvas normales diferentes. Este problema se ha resuelto prácticamente
al transformar los valores de todas las distribuciones normales a los valores de una
distribución normal estandarizada (tipificada) representada por la curva normal
estandarizada.
x
Z
y su función de distribución es
Consideremos que el peso de los niños varones venezolanos en el momento del nacimiento
se distribuyen normalmente. Si sabemos que el peso medio en el momento de nacer son
3,25 Kg. y la desviación típica es de 0,82 Kg., ¿cuál es la probabilidad de que el peso de un
niño varón al nacer sea superior a 4 Kg?
X 4 3 . 25
Z 0 . 9146
0 . 82
Por lo tanto la probabilidad de que un niño al nacer tenga un peso superior a 4 kg. es de
18.0 %.
A) Calcular P (z < –1.35) y P (z > –1.35). Solución: abajo se reproduce parte de la tabla:
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
–1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823
Recordamos que la tabla proporciona el área bajo la curva a la izquierda de z. Por lo tanto,
B) Una distribución normal tiene = 60 y = 5. Encontrar P(x < 63) y P(x > 63).
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
Al consultar la tabla (ver arriba): P(x < 63) = P(z < 0.60) = 0.7257.
Supongamos que se sabe que el peso de los sujetos de una determinada población sigue
una distribución aproximadamente normal, con una media de 80 Kg. y una desviación
Esta última probabilidad puede ser fácilmente obtenida a partir de la tabla, resultando ser
. Por lo tanto, la probabilidad buscada de que una persona elegida
aleatoriamente de esa población tenga un peso mayor de 100 Kg., es de:
De modo análogo, podemos obtener la probabilidad de que el peso de un sujeto esté entre
60 y 100 Kg:
Por el ejemplo anterior, se sabe que P ( z 2 ) 0 . 9772 . Para la segunda probabilidad, sin
embargo, encontramos el problema de que las tablas estándar no proporcionan el valor de
P ( z 2 ) para valores negativos de la variable. Sin embargo, haciendo uso de la simetría
de la distribución normal, se tiene que:
Ejemplo: Supongamos que se dispone del peso de n =100 individuos de esa misma
población, obteniéndose una media muestral de X 75 Kg., y una desviación estándar
muestral S 12 Kg., se pretende extraer alguna conclusión acerca del valor medio real de
ese peso en la población original.
Estaremos, por lo tanto, un 95% seguros de que el peso medio real en la población de
origen oscila entre 75.6 Kg y 80.3 Kg. Aunque la teoría estadística subyacente es mucho
más compleja, en líneas generales éste es el modo de construir un intervalo de confianza
para la media de una población.
Ejemplo: Supongamos que cierto fenómeno pueda ser representado mediante una
va X N ( 45 ,81 ) , y queremos calcular la probabilidad de que X tome un valor entre 39 y
48, es decir,
P 39 X 48 ??
X X 45 X 45
Z . De modo que
81 9
P 39 X 48 0 . 378 37 . 80 %.
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
Ejemplo: Imaginemos que una variable continua puede tomar valores entre 0 y 5. La
probabilidad de que tome exactamente el valor 2 es despreciable, ya que podría tomar
infinitos valores: por ejemplo: 1,99, 1,994, 1,9967, 1,9998, 1999791, etc.
Veamos ahora, como podemos utilizar esta tabla con una distribución normal:
Ejemplo: el salario medio anual de los empleados de una empresa se distribuye según una
distribución normal, con media 5 millones de Bs. y desviación típica 1 millón de Bs.
Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de Bs.
Lo primero que haremos es transformar esa distribución en una normal tipificada, para ello
se crea una nueva variable (Z) que será igual a la anterior (X) menos su media y dividida
por la desviación típica
X
Z
Esta nueva variable se distribuye como una normal tipificada. La variable Z que
corresponde a una variable X de valor 7 es:
75
Z 2
1
Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de Bs. es del
97,725%.
Ejercicio 1º: La renta media de los habitantes de un pueblo es de 4 millones de Bs/año, con
una varianza de 1,5. Se supone que se distribuye según una distribución normal. Calcular:
c) Ingresos mínimo y máximo que engloba al 60% de la población con renta media.
SOLUCIÓN:
Lo primero que tenemos que hacer es calcular la normal tipificada:
X 4
Z
1 . 22
Ahora tenemos que ver cuál es la probabilidad acumulada hasta ese valor. Tenemos un
problema: la tabla de probabilidades sólo abarca valores positivos, no obstante, este
problema tiene fácil solución, ya que la distribución normal es simétrica respecto al valor
medio.
Por lo tanto:
Por otra parte, la probabilidad que hay a partir de un valor es igual a 1 (100%) menos la
probabilidad acumulada hasta dicho valor:
b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más
elevada.
X 4
1 ,282 1 . 282 ( 1 . 22 ) X 4 X 1 . 57 4 X 5 . 57 .
1 . 22
Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a
5,57 millones de Bs. constituyen el 10% de la población con renta más elevada.
c) Nivel de ingresos mínimo y máximo que engloba al 60% de la población con renta
media
Por otra parte, al ser la distribución normal simétrica, entre -Z y la media hay otro 30% de
probabilidad. En definitiva, el segmento (-Z, Z) engloba al 60% de población con renta
media.
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97
millones de Bs. e inferiores a 5,03 millones de Bs. constituyen el 60% de la población con
un nivel medio de renta.
Ejercicio 2º: La vida media de los habitantes de un país es de 68 años, con una varianza de
25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes:
SOLUCIÓN:
75 68
Z 1 .4
5
Por lo tanto
60 68
Z 1 ,6 . Por lo tanto P (X < 60) = (Z < -1,6) = P (Z > 1,6) = 1 - P (Z < 1,6) =
5
0,0548.
a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año
para pertenecer al 5% de la población que más bebe?.
b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría
argumentar en su defensa?
Despejando X, su valor es 67,87. Por lo tanto, tendría usted que beber más de 67,87 litros al
año para pertenecer a ese "selecto" club de grandes bebedores de cerveza.
Vamos a ver en que nivel de la población se situaría usted en función de los litros de
cerveza consumidos.
45 58
Z 2 ,2
6
Por lo tanto
Luego, tan sólo un 1,39% de la población bebe menos que usted. Parece un argumento de
suficiente peso para que dejen de catalogarle de "enamorado de la bebida"
a) Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir organizando una
fiesta para celebrar su éxito?
b) Va a haber una 2ª oportunidad para el 20% de notas más altas que no se hayan
clasificados. ¿A partir de que nota se podrá participar en este "Nuevo Ingreso"?
Vamos a ver con ese 7,7 en que nivel porcentual se ha situado usted, para ello vamos a
comenzar por calcular el valor de la normal tipificada equivalente.
7 .7 5 .5
Z 2 . 1 . A este valor de Z le corresponde una probabilidad acumulada (ver
1 ,049
tablas) de 0,98214 (98,214%), lo que quiere decir que por encima de usted tan sólo se
encuentra un 1,786%.
Si se han presentado 2.000 aspirante, ese 1,786% equivale a unos 36 aspirantes; como hay
100 plazas disponibles, tiene usted suficientes probabilidades como para ir organizando la
"mejor de las fiestas".
X 5 .5
0 ,842 ( 0 . 842 )( 1 ,049 ) X 5 . 5 X ( 0 ,883 ) 5 . 5
1 ,049
X 6 ,38
Despejamos la X, su valor es 6,38. Por lo tanto, esta es la nota a partir de la cual se podrá
acudir al "Nuevo Ingreso".
Las muestras de tamaño N>30, se les llamadas grandes muestras, las distribuciones de
muestreo de muchos estadísticos son aproximadamente normales, siendo la aproximación
tanto mejor cuanto mayor sea N. Para muestras de tamaño menor que 30, llamadas
pequeñas muestras, esa aproximación no es adecuada y empeora al decrecer N, de modo
que son precisas ciertas modificaciones. El estudio de la distribución de muestreo de los
estadísticos para pequeñas muestras se llama teoría de pequeñas muestras. Sin embargo, un
nombre más apropiado sería teoría exacta del muestreo, pues sus resultados son válidos
tanto para pequeñas muestras como para grandes. En esta guía analizaremos la
Distribución de Student, la cual se designa con la letra t.
X (X )
Definamos el estadístico t N que es análogo al estadístico z dado
S S
N
X X
por Z N .
N
Dagoberto Salgado Horta Página 62
INTERVALOS DE CONFIANZA
Al igual que se hizo con la distribución normal, se pueden definir los intervalos de
confianza 95%, 99%, u otros, usando la tabla de la distribución t. De esta forma podemos
estimar la media de la población dentro de los límites especificados.
S
X t , Donde S es la desviación estándar estimada de X .
2 N N
GRADOS DE LIBERTAD
Para el cálculo de un estadístico tal como t y es necesario emplear tanto observaciones de
muestras como propiedades de ciertos parámetros de la población, si estos parámetros son
desconocidos, hay que estimarlos a partir de la muestra.
¿Qué son los grados de libertad? Se pueden definir como el número de valores que se
pueden escoger libremente.
Suponiendo que se esta trabajando con dos valores de muestra, a y b, y se sabe que tienen
una media de 18. Simbólicamente, se puede expresar:
ab
18 a b 36 . ¿Cómo se puede encontrar los valores que a y b puedan tomar
2
en esta situación? La respuesta es que a y b pueden ser cualquiera de dos valores cuya
suma sea 36, ya que 36 entre 2 es 18.
Suponiendo que a tiene un valor de 10; ahora b ya no esta libre de tomar cualquier valor,
sino que debe tomar solamente el valor 26 puesto que, si a = 10, entonces 10 + b = 36,
por lo tanto b = 26.
Este ejemplo demuestra que cuando existen 2 elementos de una muestra y solo conocemos
la media de la muestra de esos elementos, entonces somos libres de especificar solamente
uno de esos elementos, puesto que el otro estará determinado por el hecho de que los 2
elementos suman el doble de la mitad de la muestra. En términos estadísticos se dice que
tenemos un grado de libertad.
Observemos otro ejemplo. Existen 7 elementos en una muestra y se sabe que la media de
estos elementos es 16. Simbólicamente se tiene la siguiente situación:
abcd e f g
16
7
En este caso, los grados de libertad (GL) o el número de variables que se pueden
especificar libremente es 7 – 1 = 6. Se tiene la libertad de asignar valores a 6 variables, y
Dagoberto Salgado Horta Página 63
luego ya no tenemos libertad de especificar el valor de la séptima variable, puesto que esa
queda determinada automáticamente. En cada uno de los ejemplo tenemos un grado de
libertad que es igual a n – 1 grados de libertad, suponiendo que n es el tamaño de la
muestra. Utilizamos los grados de liberta cuando se elige una distribución t para estimar
una media de población, y se utilizará n – 1 GL, tomando n igual al tamaño de la
muestra.
BIBLIOGRAFÍA
Benavente del Prado, Arturo Núñez (1992): Estadística Básica par Planificación.
Editorial Interamericana. 6ª. Edición. México.
LINCON L., CHAO (1996): Estadística para Ciencias Administrativas. Cuarta edición.
Editorial McGaw-Hill. Usa.
DIRECCIONES DE INTERNET
http://www.inf.ufsc.br/cee/pasta1/art4.html
http://www.inf.ufsc.br/cee/pasta4/art1p4.html
http://193.145.158.7/asepuma01/doco16.pdf
http://www.caib.es/ibae/esdeveniment/jornades_10_01/doc/Estepa-Jornadas-Mallorca.doc
http://www.inf.ufsc.br/cee/pasta1/art4.html
Software on-line
http://it.stlawu.edu/~rlock/maa99/
http://it.stlawu.edu/~rlock/tise98/java.html
http://www.stat.vt.edu/~sundar/java/applets/
http://www.kuleuven.ac.be/ucs/java/index.htm
Demostraciones Java para el aprendizaje de la estadística
Electronic Textbook (UCLA), programa on-line de representación y cálculo de funciones de
densidad y de distribución (normal, F, ji-cuadrado, números aleatorios...). Equivalente a un
libro de tablas