Professional Documents
Culture Documents
TALLER DE ESTADISTICA
CONTENIDO
CAPITULO I: BASE TEORICA DE LA ESTADISTICA
pag.
1.1.
Definicin de estadstica
1.2.
Poblacin
1.3.
Clases de poblacin
1.4.
Muestra
1.5.
Unidad de anlisis
1.6.
Dato estadstico
1.7.
Informacin
1.8.
Indicador
1.9.
Parmetro
1.10. Estadgrafo
1.11. Variable
2.1. Encuesta
10
10
10
10
14
14
17
21
21
21
21
2.4. Ejercicios
27
29
3.1.
Medidas de Centralizacin
30
3.2.
El Promedio
30
30
30
La Moda
32
32
32
32
3.3.
34
35
35
35
36
40
41
42
44
46
46
47
47
3.8. Deciles
48
48
49
3.9. Percentiles
50
51
51
51
52
54
55
55
4.3. La Varianza
55
55
56
56
56
57
58
58
59
60
62
62
72
73
6.1.
Experimento Aleatorio
74
6.2.
Punto muestral
74
6.3.
Espacio Muestral
74
6.4.
Suceso o evento
74
6.5.
74
6.6.
Sucesos complementarios
74
6.7.
Definicin de Probabilidad
74
6.8.
Definicin
75
6.9.
Reglas de Probabilidad
75
6.10. Ejercicios
80
82
83
85
87
89
95
7.6. Ejercicios
96
Una muestra debe ser seleccionada de tal manera que sea representativa de la
poblacin.
1.5. UNIDAD DE ANALISIS
Viene a ser cada elemento que ser estudiado en un poblacin, sobre los cuales se
va a obtener datos.
En el ejemplo anterior, la unidad de anlisis viene a ser cada alumno.
1.6. DATO ESTADISTICO
Es el resultado de medir una caracterstica observable de una unidad estadstica
1.7. INFORMACION
Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay
informacin sin datos.
1.8. INDICADOR
Es una cantidad o valor que permite conocer el estado de un hecho. Son elementos
caractersticos que describen una situacin permitiendo su anlisis. Como ejemplo
de indicador tenemos a las Tasas, medidas de resumen, etc.
1.9. PARAMETRO
Se denomina parmetro a una medida descriptiva que resume una caracterstica de
la poblacin, tal como la media () o la varianza (2), calculada a partir de los
datos observados en la poblacin.
1.10. ESTADIGRAFO
Se denomina estadgrafo a una medida descriptiva que resume una caracterstica de
la muestra, tal como la media ( X ) o la varianza (S 2)calculada a partir de los datos
observados de una muestra.
1.11. VARIABLE
Es una caracterstica que puede tomar diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser
expresadas en varias categoras.
La variable adquiere un valor determinado en cada unidad de anlisis y que puede
ser medido o cuantificado.
1.12. CLASIFICACION DE LAS VARIABLES
1.12.1 De acuerdo a su naturaleza: las variables de clasifican en:
a. CUALITATIVAS:
Son aquellas que se expresan mediante palabras y pertenecen a una de varias
categoras que mutuamente se excluyen. Ejemplo: Sexo, Estado Civil,
Niveles de desnutricin, Grado de instruccin, Zona de residencia, etc.
b. CUANTITATIVAS:
Son aquellas que se expresan numricamente y dan origen a dos tipos de
variables:
b.1. Variable Discreta:
Es aquella que toma valores enteros o especficos. Ejemplo: Nmero de
alumnos, Nmero de docentes, nmero de trabajadores de una empresa,
etc.
b.2. Variable Continua:
Es aquella que puede tomar cualquier valor dentro de un intervalo dado.
Ejemplo: Ingreso econmico, Edad, Talla, peso, Tiempo, etc.
De acuerdo a la funcin que desempean en el planteamiento de un problema de
investigacin:
a. Variable Independiente: Es la variable explicativa.
b. Variable Dependiente : Es la variable explicada
1.13. ESCALAS DE MEDICION
Se denomina escala de medicin a un instrumento de medida que sirve para
cuantificar las variables.
La escala de medida orientar al investigador para el anlisis estadstico que podr
realizar. Entre las escalas de medicin se tiene:
1. ESCALA NOMINAL
Es aquella que tiene como funcin clasificar las categoras de la variables.
Ejemplo: la variable Sexo asigna a las personas dos categoras o modalidades:
masculino y femenino. Las variables Estado civil, Ocupacin, tienen
categoras o modalidades que son de escala nominal.
2. ESCALA ORDINAL
Es aquella que tiene como funcin clasificar y ordenar las categoras de las
variables en forma ascendente o descendente.
Ejemplo: Grado de instruccin, con sus modalidades: Primaria, Secundaria,
Superior.
Estatus Socioeconmicos, con sus modalidades: bajo, medio y alto.
3. ESCALA DE INTERVALO
Es aquella que tiene como funcin clasificar, ordenar, se puede conocer la
distancia entre dos puntos cualesquiera y adems tiene un punto cero relativo
como punto de partida.
Ejemplo: la temperatura, si utilizamos las escala centgrada, esta empieza en
cero, pero si utilizamos la escala Fahrenheit, esta empieza en 32 grados. Como
otros ejemplo tenemos las calificaciones de un test, la medicin de actitudes, etc.
4. ESCALA DE RAZON
Tiene como funcin clasificar, ordenar, se puede conocer la distancia entre dos
puntos y nos permite realizar las cuatro operaciones, adems tiene un punto
cero absoluto como punto de partida. En esta escala se puede establecer
relaciones de igualdad. Los valores de esta escala se obtienen en general por
mediciones. Ejemplo: Talla, Peso, Edad, Ingresos econmicos, volumen, etc.
1.14.
CLASIFICACION DE LA ESTADISTICA:
2.1.
DISEO DE LA ENCUESTA
Nota: La Encuesta ser respondida por el responsable de la familia.
1. Nombres:..
apellidos:..............................................................................................
2. Anote
el
ciclo
de
estudios
de
su
hijo: .......................................................................
3. Indique su Estado Civil:
a. Casado (a)
( )
c. Separado (a)
( )
b. Conviviente
( )
d. Divorciado (a)
( )
e. Viuda
( )
f. Madre Soltera
( )
( )
( )
c. Zona Rural
( )
( )
2. Alquilada ( )
3) Otras Formas:...................................
b. Indique
cuantas
habitaciones
tiene
vivienda:..........................................
c. En su vivienda existe un ambiente de estudio para su hijo?
Si
( )
No
( )
su
( )
d. Ama de casa
( )
b. Obrero
( )
e. Otras
( )
( )
( )
( )
( )
e. Ms de 1100 soles
( )
( )
b. Dos Soles
( )
c. Tres Soles
( )
d. Ms de tres Soles ( )
10. Indique su nivel de instruccin
a. Iletrado (a)
( )
b. Primaria
( )
c. Secundaria
( )
d. Superior No Universitaria
( )
e. Superior Universitaria
( )
( )
b. 1 a 2 horas
( )
c. 2.1 a 3 horas
( )
d. Ms de 3 horas
( )
( )
b. 11 a 15
( )
c. 16 a 20
( )
2.2.
Ejem.
CUADRO N 1
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO
SEGN GRADO DE INSTRUCCIN
NIVEL DE INSTRUCCIN
Primaria
2.86
Secundaria
11
15.71
Sup. No Universitaria
42
60.00
Sup. Universitaria
Total
15
70
21.43
100.00
NIVEL DE INSTRUCCION
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
TOTAL
ZONA DE RESIDENCIA
Urbana
Urbano
Rural
N
3
26
12
41
%
4.29
37.14
17.14
58.57
Marginal
N
%
1
1.43
6
8.57
13
18.57
3
4.29
23
32.86
N
1
2
3
6
%
1.43
2.85
4.29
8.57
TOTAL
N
%
2
2.86
11 15.71
42 60.00
15 21.43
70 100.00
b. DE VARIABLE CUANTITATIVA:
b.1. CUADROS UNIDIEMNSIONALES:
Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos
econmicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.
CUADRO N 3
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO
INGRESO
ECONOMICO
INGRESO ECONOMICO
b.2.
SEGN
500
700
7.14
701
900
11.43
901
1100
15
21.83
1101 - 1300
25
35.71
1301 - 1500
TOTAL
17
70
24.29
100.00
CUADRO N 4
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGN
Econmico
500 - 700
701 - 900
901 - 1100
1101-1300
1301-1500
Total
Rendimiento
11-15
N
3
2
4
4
2
15
%
4.29
2.86
5.71
5.71
2.86
21.43
N
2
5
8
21
14
50
16-20
%
2.85
7.14
11.43
30.0
20.0
71.42
N
1
3
1
5
%
1.43
4.29
1.43
7.15
Total
N
5
8
15
25
17
70
%
7.14
11.43
21.43
35.71
24.29
100
Urbana
Ingreso
Econmico
500 - 700
701 - 900
901 - 1100
1101- 1300
1301- 1500
Total
N
2
9
18
12
41
Zona de Residencia
Urbano
%
2.86
12.86
25.71
17.14
58.57
marginal
N
%
1
1.43
4
5.71
6
8.57
7
10
5
13.15
23 32.86
Rural
N
4
2
6
%
5.71
2.86
8.57
Total
N
5
8
15
25
15
70
N de datos
Li
Ls
Recorrido o rango
N de intervalos
amplitud intervlica
%
7.14
11.43
21.43
35.71
24.29
100.00
Xi
ni
Frecuencias absolutas
hi
Frecuencias relativas
Ni
Hi
hix100:
Hix100:
profesores de de 75 colegios:
49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49,
51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49,
47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48,
50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51,
52, 48, 51
a. Elabore una tabla de frecuencias para analizar los datos.
b. Interprete la tabla
Solucin
TABLA N 6
DISTRIBUCION DE FRECUENCIAS DE LOS
PROFESORES DE 75 COLEGIOS
Xi
ni
hi
Ni
Hi
hix100
Hix100
46
0.11
0.11
11
11
47
10
0.13
18
0.24
13
24
48
16
0.21
34
0.45
21
45
49
14
0.19
48
0.64
19
64
50
12
0.16
60
0.80
16
80
51
0.12
69
0.92
12
92
52
0.08
75
1.00
100
75
1.00
100
PROCEDIMIENTO
En la primera columna se colocan los valores que toma la
variable
Xi .
Las frecuencias absolutas ni, resultan de contar cuantas veces
se repite los valores que toma la variable, es decir, cuantas
veces se repite el 1, cuantas veces se repite el dos, etc.
Las frecuencias relativas hi, resultan de dividir cada frecuencia
absoluta entre el total de datos (80).
La frmula para encontrar cada frecuencia relativa es hi
lo que resulta: h1
h1
n1
n
n
; h2 2 ; h3 3 ; etc.
n
n
n
8
0.11
75
h2
10
0.13
75
N 2 18
N 3 8 10 16 34
As sucesivamente.
N 3 34
ni
, de
n
H 2 h1 h2
H 1 0.11
H 3 h1 h2 h3
H 2 0.24
H 3 0.45
n5 = 12
h2 = 0.13
h4 = 0.19 :
profesores
N3 = 34
34 colegios tienen de 46 a 48
profesores
N6 = 69
69 colegios tienen de 46 a 51
profesores
H3 = 0.45
H5 = 0.80
h4 x 100 = 19
h6 x 100 = 12
H3 x 100= 45
H5 x 100= 80
[yi-1-yi)
454.5 - 587.5
yi
521
ni
5
hi
0.08
Ni
5
Hi
0.08
hix100
8
Hix100
8
587.5 720.5
654
0.08
10
0.16
16
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
TOTAL
787
920
1053
1186
1319
10
13
16
8
5
62
0.16
0.21
0.26
0.13
0.08
1.00
20
33
49
57
62
0.32
0.53
0.79
0.82
1.00
16
21
26
13
8
100
32
53
79
82
100
PROCEDIMIENTO.
1. Para construir
maneras:
a. Por Conveniencia: De acuerdo a la naturaleza del trabajo
de investigacin y en funcin a la utilidad de informacin
que le pueda brindar al investigador, se pueden construir
los intervalos. No necesariamente los intervalos deben
tener la misma amplitud.
b. Metodologa para Construir los Intervalos: Existe una
metodologa que se utiliza
m = 2.5
4 62
m=7
3 Se determina la amplitud del intervalo ( c ):
C=
R 928
132.5714286
M
7
931
133
7
de
distribucin
para
variable
discreta,
descrita
anteriormente.
Para la interpretacin de los valores de la tabla se procede de
manera similar que se hizo para la tabla de frecuencia de
variable discreta (Tabla anterior).
.Como ejemplo interpretaremos algunos valores:
n4 = 13: 13 trabajadores tienen un ingreso de 853.5 a 986.5
soles.
n3=10 Vrs. Y3=787: 10 trabajadores tienen un ingreso promedio
de
787 soles.
h5=0.24: El 0.24 por uno de trabajadores tienen un ingreso de
986.5
a 1119.5 soles.
2.3.
1252.5 soles.
REPRESENTACIONES GRAFICAS
Un grfico es un medio para representar de manera objetiva los datos de
una tabla estadstica. Los grficos se elaboran en funcin del tipo de
variable que se quiere representar.
2.3.1
CONSTRUCCION DE GRAFICOS:
Existen una diversidad de grficos, cuya forma depender de las variables
de estudio y de los objetivos de estudio.
Los grficos de una sola variable sirven para fines comparativos de cifras
absolutas o porcentuales y pueden tener la forma de barras, superficies o
lneas.
Los grficos de dos variables se construyen en el plano de coordenadas
cartesianas.
b. Histograma de Frecuencias:
Se construye para variables de tipo cuantitativo y consiste en barras
que van unidas. Para la ilustracin tomaremos los datos de la tabla
N 7.
1999
450
2000
530
2001
600
2002
690
2003
770
2004
855
EJERCICIOS
1. La inversin mensual en compra de computadoras, en miles de dlares, por 48
pequeas empresas fue:
31 17 27 20 28 10 34 25 14 24 40 35 15 39 18 30 41 26
12 46 18 23 36 19 29 37 33 27 27 24 26 31 32 28 25 28
33 28 22 23 31 29 35 21 30 25 38 31.
a. Construir una tabla de frecuencias para analizar los datos, considerando un
intervalo
abierto por la derecha y cerrado por la izquierda. Interprete.
b. Determinar el N de empresas con una inversin menor a 25 mil dlares.
c. Determinar el porcentaje de empresas con una inversin entre 14 mil y 20 mil
dlares.
2. Con los datos del problema N 1, elabore una tabla de frecuencias utilizando un
intervalo cerrado por ambos lados. Interprete la tabla.
3. Los siguientes datos corresponde a las notas en el curso de estadstica de 52
alumnos:
12 11 12 12 7 8 12 12.5 9.5 9 9 12 7.5 12.5 10 9 11.5 13
10.5 10 12 8 14 12 11 16 12 15 9 10.5 12 12 10 13.5 12 18
10 11 10 17 12.5 10.5 14 11 10.5 14.5 12.5 11.5 12 13 11 11.5
.
Construir una tabla de frecuencias utilizando intervalos cerrados por ambos
lados. Interprete la tabla y haga la representacin grfica correspondiente.
4. Los siguientes datos corresponde al N de libros de estadstica consultados por
50
estudiantes para rendir su primer examen parcial.
2 3 4 4 0 4 0 2 1 1 0 3 0 2 2 0 3 0 4 1 0 1 2 0 1 1
5
0 5 0 3 2 0 5 4 1 1 0 4 2 1 1 4 6 2 1 2 3 0 3.
Construir una tabla de frecuencias e interprete la tabla.
5. Con respecto a la tabla de frecuencias del problema anterior se pide:
a. Qu porcentaje de alumnos consult de 4 a 6 libros?
b. Qu porcentaje de alumnos no consult ningn libro?
c. Qu porcentaje de alumnos consult hasta 3 libros?
Hi x100
ni
12
Yi
hi
0.20
Ni
Hi
hix100
60
70
85
Totales
11. El peso en gramos de 30 objetos de un mismo tipo son los siguientes : 21.3 15.8
18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8 22.7 18.0 20.5 11.0 18.5
23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
a. Construir una tabla de frecuencias de 6 intervalos de clase.
b. Calcular el porcentaje de objetos cuyo peso sea 21.5 gr. o ms.
c. Calcular el peso debajo del cual se encuentran el 25% de los objetos.
13. Las puntuaciones de un tes aplicado a un grupo de trabajadores de una empresa
se tabularon en una distribucin de frecuencias de 6 intervalos de igual amplitud. La
marca de clase del segundo intervalo es 25 y el lmite superior del quinto intervalo es
60, si las 4 primeras frecuencias relativas porcentuales son respectivamente de 15,
20, 35 y 14 y si el 94% de las puntuaciones son menores que 60. Elabore la tabla de
frecuencias e indique el porcentaje de trabajadores que tienen entre 38 y 53 puntos.
CAPITULO III
MEDIDAS DE CENTRALIZACIN
Las Medidas de Centralizacin o de Tendencia Central son parmetros estadsticos que
expresan en forma resumida un conjunto de datos. Estos parmetros a travs de sus
propiedades y sus definiciones hacen posible el anlisis de un conjunto de datos.
3. EL PROMEDIO O MEDIA ARITMTICA
3.1. PROMEDIO PARA DATOS ORIGINALES: Se denomina datos originales a
un conjunto de datos de cualquier variable y copiados de cualquier manera. La
frmula para su clculo es:
n
xi
i 1
n: N de datos
x 1093.75
soles
FORMULA:
x i ni
i 1
ni
8
10
16
14
12
9
6
75
FORMULA:
y i ni
i 1
intervalo
Ejemplo: Se tomarn los datos de la tabla N 7
Ingreso
Econmico
454.5 - 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total
yi
ni
521
654
787
920
1053
1186
1319
5
5
10
13
16
8
5
62
521x5 654 x5 787 x10 920 x13 1053 x16 1186 x8 1319 x5
62
y 945.74
y
ni
8
10
16
14
12
9
6
75
FORMULA:
n j n j 1
Md y j 1 c
( n j n j 1 ) ( n j n j 1 )
ni
5
5
10
13
16
8
5
62
De acuerdo a la teora:
nj
= 15 yj-i = 986.5
nj-1
= 13
c = 133
nj+1 = 8
Reemplazando valores en la frmula se tiene:
15 13
15 13 15 8
Md 986.5 133
Md 1022
NIVEL DE INSTRUCCIN
Primaria
2.86
Secundaria
11
15.71
Sup. No Universitaria
42
60.00
Sup. Universitaria
Total
15
70
21.43
100.00
Me
50%
Ls
50%
La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a
rangos.
3.3.1. MEDIANA PARA DATOS CUANTITATIVOS:
3.3.1.1. Mediana para Datos Originales
Se presentan dos caso:
a. Cuando el N de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio
de los dos valores del centro.
Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61
38 42
2
Me 40
Me
n
N j 1
2
FORMULA:
Me = xj
Donde:
xj
Nj
Nj-1
Xi
46
47
48
49
50
51
52
Total
Procedimiento:
1
n 75
37.5
2
2
2 Nj 48
ni
8
10
16
14
12
9
6
75
Ni
8
18
34
48
60
69
75
n
2
3 Nj 1 34
efectivamente
n
N j 1
2
4 Xj 49
Por lo tanto: Me = 49
50% de las empresas tienen como mximo 49 trabajadores.
2 Cuando
n
N j 1
2
x j 1 x j
FORMULA:
ni
Ni
5
10
12
15
8
4
54
5
15
27
42
50
54
Procedimiento:
1
n 54
27
2
2
2 N j 42
3 N j 1 27
efectivamente
n
N j 1
2
4 x j 4
5 x j 1 3
Reemplazando valores:
Me
3 4
3.5
2
n
N j 1
2
n 2 N j 1
Me y j 1 c
FORMULA:
N j N j 1 )
Donde:
procedimiento:
1
n 62
31
2
2
2 Nj= 33
ni
5
5
10
13
16
8
5
62
Nj
5
10
20
33
49
57
62
3 N j 1 20
efectivamente
n
N j 1
2
4 Y j 1 853.5
5 c = 133
Reemplazando valores se tiene:
31 20
33 20
Me 853.5 133
Me 966.04
n
N j 1
2
FORMULA:
Me y j 1
Peso
30 33
34 37
38 41
42 45
46 49
50 53
Total
ni
10
20
30
30
16
14
120
Ni
10
30
60
90
106
120
Procedimiento:
1
n 120
60
2
2
2 N j 90
3 N j 1 60
efectivamente
n
N j 1
2
4 y j 1 42
5 c 3
Reemplazando valores se tiene:
Me 42
ni
2
11
42
15
70
Total
Ni
16
54
72
80
Procedimiento:
1
n
35
2
2 N j 54
3 N j 1 16
La mediana esta dada por la categora que se encuentra en la misma fila de Nj. Por lo
tanto, la mediana est dada por la categora Secundaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin
mximo de secundaria.
Q1
Q2
25%
50%
75%
Q3
Ls
x1 x2 x3 .... xn . El cuartil i-
i
)( n 1 ) en el
4
ordenamiento.
Si la posicin resulta entera, se hace una interpolacin lineal entre los dos
valores correspondientes a las dos observaciones entre las cuales se encuentra
la fraccin.
Ejemplo N 1
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
econmicos semanales de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540
x1
x2
x3
x4
x5
x6 x7
i
1
)( n 1 ) ( )( 7 1 ) 2 , posicin entera, luego Q1 = x2 = 225.
4
4
i
2
)( n 1 ) ( )( 7 1 ) 4 , posicin entera, luego Q2 = x4 = 420.
4
4
i
3
)( n 1 ) ( )( 7 1 ) 6 , posicin entera, luego Q3 = x6 = 460.
4
4
Ejemplo N 2
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
semanales de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650
x1
x2
x3
x4
x5
x6
x7 x8
x9 x10
i
1
)( n 1 ) ( )( 10 1 ) 2.75 , posicin no entera, luego Q1 estar entre
4
4
Q1 x2 ( x3 x2 )( 0.75 )
x3 x2
1
Q 225 ( 300 225 )( 0.75 )
Q 225 56.25
Q 281.25
i
2
)( n 1 ) ( )( 10 1 ) 5.5 , posicin no entera, luego Q2 estar entre
4
4
i
3
)( n 1 ) ( )( 10 1 ) 8.25 , posicin no entera, luego Q3 estar entre
4
4
Q3 x8 ( x9 x8 )( 0.25 )
550 ( 600 550 )( 0.25 )
550 12.5
Q2 562.5
Qi y j 1
FORMULA:
n(i )
4 N j 1
c
N j N j 1 )
Ejemplo
Para la tabla N 7, calcular el primer, segundo y tercer cuartil.
- Clculo del primer cuartil (Q1): i = 1
Procedimiento: Es parecido al de la mediana
1
n i 621
15.5
4
4
2 Nj = 20
3 Nj-1 = 10
4 yj-1 = 720.5
5 C
= 133
Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total
ni
5
5
10
13
16
8
5
62
Ni
5
10
20
33
49
57
62
Q1 y j 1
n(1)
4 N j 1
c
N j N j 1 )
15 10
20 10
Q1 720.5 133
Q1 787
El 25% de los trabajadores, es decir 16, tienen un ingreso mximo de 787 soles.
- Clculo del segundo cuartil (Q2): i = 2
Q2 y j 1
n( 2)
4 N j 1
c
N j N j 1 )
Procedimiento:
1
n i 62 2
31
4
4
2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:
31 20
Q2 853.5 133
33 20
Q2 966.04
El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966.04 soles.
Q3 y j 1
n(3)
4 N j 1
c
N j N j 1 )
Procedimiento:
1
n i 62 3
46.5
4
4
2 NJ = 48
3 Nj-1 = 33
4 Yj-1 = 986.5
5 C
= 133
48 33
Q3 986.5 133
Q3 1106 .2
El 75% de los trabajadores, es decir 47, tienen un ingreso mximo de 1106.2 soles.
3.5. MEDIDAS DESCRIPTIVAS DE RESUMEN UTILIZANDO CUARTILES
Llos cuantiles son tiles no slo como medidas de posicin no central; tambin sirven
para elaborar otras medidas importantes de tendencia central y dispersin.
Describiremos dos medidas basadas en los cuarteles: el Eje Medio y el Rango
intercuartlico.
3.5.1. EL EJE MEDIO:
Es el promedio de los cuarteles Q1 y Q3 de un conjunto de datos:
EJE MEDIO =
Q1 Q3
2
790 1092.5
2
Q1
Mediana ,
Q3
Ls
Para los datos originales que sirvieron para el construir la tabla N 7 se tiene:
Li = 456 ,
Q1 = 790 , Me = 950 ,
Q3 = 1092.50 ,
Ls = 1384
El diagrama de bloques y lneas ofrece una representacin grfica de los datos a travs
de los cinco nmeros de resumen. En la siguiente figura se ilustra este diagrama.
,1
1
4
0
,1
2
0
,8
0
0
,6
0
,4
0
0, In
g
re
so
3.7. DECILES (Di)
Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados,
en 10 partes.
El decil i simo es el valor del dato que ocupa la posicin
i
)( n 1 ) en el
10
ordenamiento.
Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
3.7.1. DECILES PARA DATOS ORIGINALES
EJEMPLO : Tomaremos los datos correspondiente al ingreso semanal,
previamente ordenados. de 9 trabajadores de una empresa
x1
x2
x3
x4
x5
x6 x7 x8
x9
2
)( 9 1 ) 2 : Posicin entera
10
6
)( 9 1 ) 6 : Posicin entera
10
FORMULA:
Di y j 1
n(i )
10 N j 1
c
N j N j 1 )
Ejemplo
Para la tabla N 7, calcular el cuarto decil.
Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total
ni
5
5
10
13
16
8
5
62
Ni
5
10
20
33
48
56
62
Procedimiento:
1
n i 62 4
24.8
10
10
2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:
D4 y j 1
n(4)
10 N j 1
c
N j N j 1 )
24.8 20
D4 853.5 133
33 20
D4 902.61
i
)( n 1 )
100
Pi y j 1
n(i )
100 N j 1
c
N j N j 1 )
Ct
x100
Ct 1
Ejemplo: Calcular las tasas de creciminto para los siguientes datos, correspondiente al
N de alumnos matriculados de una universidad, durante el periodo 2005 2010
Ao
N alumnos
2005
2006
2007
2008
2009
2010
1250
1500
1850
2120
2430
2870
Tasa (%)
xi
20.00
23.33
14.59
14.62
18.11
FORMULA:
log xi
MG Anti log
i 1
Ejemplo:
Calcular la media geomtrica para los siguientes datos, correspondiente al N
de alumnos matriculados de una universidad, durante el periodo 2000 2005.
Ao
N alumnos
2005
2006
2007
2008
2009
2010
1250
1500
1850
2120
2430
2870
Tasa (%)
xi
20.00
23.33
14.59
14.62
18.11
Log xi
1.301030
1.367915
1.164055
1.164947
1.257918
6.255865
Reemplazando en la frmula:
6.255865
MG Anti log
MG 17.83
n log Yi
i
MG Anti log
FORMULA:
Yi
521
654
787
920
1053
1186
1319
62
MG = Antilog
ni
5
5
10
13
16
8
5
62
ni logYi
13.584189
14.077889
28.959747
38.529242
48.358854
24.592678
15.601224
183.703823
MG = 918.26
El ingreso econmico promedio de los 62 trabajadores es de 918.26 soles.
En este caso la medida ms adecuada para el anlisis de los datos es el
Promedio.
Ejercicios
Para los ejercicios del capitulo anterior, calcular el promedio, moda ,mediana,
Cuartiles,y Media Geomtrica ponderada.
CAPITULO IV
MEDIDAS DE DISPERSION
( xi x )2
i 1
Ejem. Los siguientes datos corresponde a los ingresos econmicos por semana de 12
trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la frmula, primero debemos encontrar el promedio y luego
aplicar la frmula de la varianza.
n
xi
i 1
n
600 650 200 710 300 550 420 460 450 540 850 225
12
5922
x
12
x 496.25
x
( xi x )2
i 1
4.3.2
DESVIACIN ESTANDAR:
( xi x )2
i 1
2
186.89
34929.685
Soles
4.3.3
FORMULA:
( xi x )2 ni
i 1
ni
46
47
48
49
50
51
52
Total
8
10
16
14
12
9
6
75
xini
( xi x )2
( xi x )2 ni
8.0656
3.3856
0.7056
0.0256
1.3456
4.6656
9.9856
64.5248
33.856
11.2896
0.3584
16.1472
41.9904
59.9136
228.08
368
470
768
686
600
459
312
3663
x n
i
n
3663
x
75
x 48.84
2
2
Desviacin estndar:
3.0411
1.74
FORMULA:
( yi y )2 ni
i 1
yi
ni
521
654
787
920
1053
1186
1319
5
5
10
13
16
8
5
62
yini
( yi y )2 ni
2605 920343.5722
3270 438175.6132
7870 265795.3084
11960
11725.2076
16848 159035.2086
9488 445446.0435
6595 816822.9819
58636 2930667.8712
y 945.74 Soles
2
2
Desviacin estndar:
47268.83662
217.41 Soles
La variacin promedio que existe entre los ingresos econmicos de los trabajadores
con respecto al ingreso promedio (945.74 soles) es de 217.41 Soles.
4.3.4. PROPIEDADES DE LA VARIANZA
a. La varianza de una constante es cero:
V(K)=0
b. La varianza del producto de una constante por una variable, es igual :
V ( K.X ) = K2 X
c. La varianza de la suma de una variable ms una constante, es igual a la varianza de
la variable: V ( X + K ) = V(X)
4.3.5. COEFICIENTE DE VARIACIN (C.V)
Es una medida de variabilidad relativa que se utiliza para comparar dos o mas
distribuciones de datos cuando las unidades de medida de las variables estn
C .V
FORMULA:
* 100
y
3( y Me )
As
y Md
El primero es el ms usual.
Interpretacin
1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden
y Me Md
m4
4
Donde 4 = ( 2 )2
Y
m4 =
-
Y ni
4
19.45254
9.2416
a = 2.10
Como a = 2.10 es menor que 3, la distribucin es platikrtica (aplanada).
Ejercicios.
Para las tablas de frecuencias del capitulo II calcular: La varianza, la desviacin
estndar, el coeficiente de variacin, el apuntamiento y la asimetra.
CAPITULO V
5.1 Generalidades
Cuando en un trabajo de investigacin se observa simultneamente dos
variables en cada elemento de anlisis, entonces estamos en el campo
de las estadsticas bidimensionales, cuya agrupacin, da origen a las
distribuciones de frecuencias bidimensionales.
En el caso bidimensional puede darse el caso de que se tenga:
1. Las dos variables discretas
2. Una variable discreta y la otra continua
3. Las dos variables continuas.
5.2.DISTRIBUCION
DE
FRECUENCIAS
BIDIMENSIONALES
DE
VARIABLE DISCRETA
Una tabla bidimensional de frecuencias se construye colocando en el margen
izquierdo los distintos valores de X y en el margen superior los distintos valores de
Y, generndose una tabla de p filas y q columnas.
5.2.1. Frecuencias Marginales
Las frecuencias marginales de la variable X, se obtiene sumando las frecuencias
absolutas que figuran en cada fila ( lnea horizontal)
q
ni. =
n
j 1
ij
n.j =
n
i 1
ij
X 6 4 6 6 5 57 6 7 5 6 7 6 7 7 7 7 6 5 7 7 3 7 7 6 4 7 6
Y 3 1 5 4 4 2 4 3 5 3 5 5 3 4 5 6 6 3 3 5 6 2 5 6 5 2 6 6
ni .
1
10
18
22
10
18
11
10
60
n.j
X : computadoras
Y : Ing. Informticos
ni. = Frecuencias marginales de la variable X
n.j = Frecuencias marginales de la variable Y
INTERPRETACIN:
n23 = 2: 2 empresas tienen 4 computadoras y 3 Ing. Informticos
n45 = 4 : 4 empresas tienen 6 computadoras y 5 Ing. Informticos
Frecuencias Marginales:
- De la variable X
n2. = 7 : 7 empresas tienen 4 computadoras
hi.
0.02
0.03
0.05
0.03
0.05
0.03
0.11
0.03
0.10
0.03
0.16
0.03
0.12
0.07
0.07
0.02
0.31
0.05
0.08
0.10
0.12
0.37
0.30
0.18
0.17
0.14
1.00
7
h.j
0.02
0.05
0.16
Interpretacin:
h23 = 0.03 : El 0.08 por uno de empresas tienen 4 computadoras y 3 Ing. Informticos
h45 = 0.07: El 0.07 por uno de empresas tienen 6 computadoras y 5 Ing. informticos
Frecuencias Relativas Marginales:
- De la variable X:
h2. = 0.11: El 0.11 por uno de empresas tienen 4 computadoras
h4. = 0.31: El 0.31 por uno de empresas tienen 6 computadoras
- De la variable Y:
h.3 = 0.30 :El 0.30 por uno de empresas tienen 3 Ing. Informticos
Y
X
10
10
10
10
10
18
20
20
20
12
27
31
35
36
13
31
42
52
60
Interpretacin:
N23 = 10: 10 empresas tienen de 3 a 4 computadoras y de 1 a 3 Ing. Informticos
N35 = 20: 20 empresas tienen de 3 a 5 computadoras y de 1 a 5 Ing. Informticos
TABLA N 11
Y
X
0.02
0.08
0.08
0.08
0.08
0.08
0.05
0.13
0.16
0.16
0.16
0.16
0.05
0.16
0.29
0.32
0.32
0.32
0.05
0.19
0.44
0.54
0.61
0.63
0.05
0.21
0.51
0.69
0.86
1.00
Interpretacin :
H25 = 0.16: El 0.16 por uno de empresas tienen de 3 a 4 computadoras y de 1 a 5
ingenieros informticos
H34 = 0.32: El 0.32 por uno de empresas tienen de 3 a 5 computadoras y de 1 a 4 ing.
Informticos
TABLA N 12
Distribucin de Frecuentas Relativas Bidimensionales Porcentuales (hijx100) de 60
empresas (X) segn nmero de Ing. Informticos (Y) por empresa
Y
X
hi.
1
11
10
16
12
31
10
12
37
16
30
18
17
14
100
h.j
Interpretacin:
h34 = 3: El 3% de empresas tienen 5 computadoras y cuatro ingenieros informticos
h45= 7: El 7% de empresas 6 computadoras y 5 ingenieros informticos
TABLA N 13
13
16
16
16
29
32
19
44
54
0.61
0.63
21
69
0.86
1.00
51
Interpretacin:
H22x100 = 13: El 13% de empresas tienen de 3 a 4 computadoras y de uno a dos ing.
Informtico.
H43x100 = 44: El44 % de empresas tienen de 3 a 6 computadoras y de uno a tres Ing.
Informticos
1i
ni .
n..
3 x 3 4 x 7 5 x10 6 x18 7 x 22
5.82
60
x 5.82
PARA Y:
n. j
n..
y 3.65
CALCULO DE LA VARIANZA
a.
PARA X :
12
( x
x ) 2 ni .
n..
Reemplazando valores:
12
60
60
60
1.42
12
12
1 1.19
b.
PARA Y:
22
( y
y 2 ) 2 n. j
n..
Reemplazando valores:
22
(1 3.65) 2 x 3 ( 2 3.65) 2 x10 (3 3.65) 2 x18 ( 4 3.65) 2 x11 (5 3.65) 2 x10 (6 3.65)
60
1.99
22
2 1.41
Ejem. Los siguientes datos corresponde al ingreso mensual (X) y al N de hijos (Y)
De 60 trabajadores de una empresa:
X 1095 1060 1450 1520 1320 1580 1600 1080 1150 1200 1190 1475
Y
X 1515 1100 1420 1580 1280 1200 1550 1170 1800 1020 1525 1435
Y
X 932 1180 1365 932 1415 1553 1225 1650 1181 932 1429 1300 1030
Y
X 1620 1485 1305 1425 1390 1450 1380 1700 1515 1200 1320 1650 1650
Y
X 1380 1540 1120 1305 1750 1300 1250 1415 1670 1380
Y
Ls = 6
Tabla N 14
Distribucin de frecuencias absolutas bidimensionales (nij) de ingresos
econmicos (X) y Nmero de hijos (Y) de 60 trabajadores de una empresa
[Xi-1 Xi]
932 - 1056
1057 - 1180
1181 - 1304
1305 - 1428
1429 - 1552
1553 - 1676
1677 - 1800
n.j
Yi
Xi
994
1118.5
1242.
1366.5
1490.5
1614.5
1738.5
ni.
2
1
3
1
5
4
2
12
1
2
5
4
3
2
1
4
4
4
1
2
1
2
3
-
2
-
17
14
5
8
10
13
12
9
3
60
3
1
-
n52 = 5 : 5 trabajadores tienen un ingreso de 1429 a 1552 soles y tienen 2 hijos por
trabajador.
n4. = 13: 13 trabajadores tienen un ingreso de 1305 a 1428 soles
n.5 = 8 : 8 trabajadores tienen 5 hijos cada uno
n3. = 10 Vrs. Y3 = 1242: 10 trabajadores tienen un ingreso promedio de 1242 soles.
El resto de tablas de frecuencias bidimensionales se construyen de manera similar a las
tablas anteriores.
2. Variable X:
a. Promedio:
n
X=
X n
i
i 1
i.
n..
994 x 5 1118 .5 x8 1242 x10 1366.5 x13 1490.5 x12 1614.5 x 9 1738.5 x 3
60
X 1362.24
2
2
X
i 1
X ni .
2
2 41548.80
= 203.84
La variacin promedio que existe entre los ingresos de los trabajadores con respecto al
ingreso promedio es de 203.84 soles.
5.4. EJERCICIOS:
1. Los siguientes datos corresponde la edad y al nmero de hijos de 50 padres:
Edad: 34 33 44 40 33 50 32 44 36 43 38 39 42 39 31 28 28 21 44
Hijos 3 2 5 4 3 6 3 4 3 5 3 2
4 5 3
2 2 1 5
Edad: 46 32 46 34 30 34 42 39 48 36 32 39 30 45 26 40 38 47 36 60
Hijos 6 2 6 3 2 3 4 3 5 3 2 3 2 3 2 3 2 5 4 6
Edad: 40 45 33 32 45 28 25 35 48 40 30
Hijos: 3 2
2 3 4 2 2 3
4 3 2
Construya tablas bidimensionales para analizar los datos.
2. Encuentre el promedio y la varianza para cada una de las variables del problema
anterior.
3. Los siguientes datos corresponde a los ingresos econmicos mensuales de 52
trabajadores de una empresa y a los aos de servicio:
Ingresos: 750 693 789 890 1240 945 1320 1200 1350 780 865 946 1050 830
Aos de 4 3
4
4
6
5
8
6
7
4
5
6
6
5
Servicio
Ingresos : 1560 1450 1000 1230 1500 1680 984 960 1380 1400 1600 1284
Aos de : 10
12
10 14
12
16 10 9
13
20
18
14
Ingresos : 1320 1245 965 845 760 896 1300 840 730 645 798 1620 1740 840
Aos de : 15
17 12 14 11 10 18 9
8
4 6
22 24
8
Servicio
Ingresos : 1350 1000 1120 1040 1080 1600 1750 1800 960 830 977 1120
Aos de 16
10
14
12
11 22
20
28
20 12 14
15
Servicio
Construir tablas de frecuencias bidimensionales para analizar los datos.
4. Para la tabla de frecuencias absolutas bidimensionales del problema anterior, calcular
el promedio , la varianza y la desviacin estndar.
CAPITULO VI :
PROBABILIDADES
6.1.
6.2.
6.3.
6.4.
6.4.2.
E2 = {2}
E3 = {5}
6.6.
E = { 5, 6 }, entonces estos
a.
0 P( E ) 1
b.
P( S ) = 1
La parte a, significa que toda probabilidad de un evento siempre vara entre cero
y uno.
La parte b, significa que siempre la probabilidad de un espacio muestral es igual
a la unidad
Grado Acadmico
Especialidad
Maestra
Doctorado
(C)
(D)
11
14
15
20
TOTAL
Ing. Infrmtico
(A)
Ing. Industrial
(B)
TOTAL
P(A U C) = P(A) + P(C) P(AWC)
P( AUB ) = 14/20 + 15/20 11/20 = 18/20 = 0.90
b. Regla de la Adicin para sucesos independientes: Sean A y B dos eventos
independientes pertenecientes al espacio muestral S, entonces se cumple que:
P(AUB) = P(A) + P(B).
Ejem. En el aula A de una universidad se tiene 18 alumnos varones y 8 alumnas
mujeres. Se elige un alumno cual es la probabilidad de que el alumno elegido sea
hombre o mujer?.
Solucin:
Sea H alumnos hombres y M alumnas mujeres, entonces: P(HUM) = P(H) + P (M) ,
reemplazando valores:
P(HUM) = 18/26 + 8/26 = 1.
2 / 20
= 2/5 = 0.40
5 / 20
d. Regla de la multiplicacin:
Sean A y B dos eventos pertenecientes al espacio muestral S , entonces se cumple
que : P(AWB) = P(A) P(B/A).
Ejem. En un curso de programacin, 22 alumnos aprobaron el curso y 10
desaprobaron. Se extraen dos alumnos, uno tras otro y sin reposicin Cul es la
probabilidad de que el primer alumno elegido y el segundo hayan aprobado el curso:
Sea A , alumnos aprobados y sea D, alumnos desaprobados, entonces
P(A1WA2) = P(A1) P(A2/A1), remplazando valores se tiene:
P(VWH) = 22/32* 21/31 = 462/992 = 0.47
e. Regla de la multiplicacin para sucesos independientes
Sean A y B dos sucesos independientes pertenecientes al espacio muestral S,
entonces se cumple que : P(AWB) = P(A) P(B)
Ejem Se tiene dos grupos de alumnos, A y B que llevan el curso de matemticas. En el
grupo A se tiene 32 alumnos aprobados y 10 desaprobados. En el grupo B se tiene 36
alumnos aprobados y 8 desaprobados . Se extrae un alumno del grupo A y luego un
alumno del grupo B . Cual es la probabilidad de que el primer alumno elegido haya
sido un aprobado y el segundo un desaprobado.
Solucin:
Sea a , alumnos aprobados y sea d, desaprobados, entonces
256/1760 = 0.15.
f. Regla de Bayes
Sean A1, A2, A3, ., An , n eventos pertenecientes al espacio muestral Sy sea B
un evento cualquiera, con P(B) > 0, entonces se cumple que :
Ai
Ai
n
B
B
P Ai P
Ai
i 1
P Ai P
E 1 18
P A
3 33
1
3
1
3
18
33
25 1
42 3
18
99
0.32
18
25 14
14
99 126 75
25
P B P E / B
b) P B E
P ( A) P ( E / A) P ( B ) P ( E / B ) P (C ) P ( E / C )
PB
c) P C E
1
3
1 18 1
3 33 3
25
25
42
84
0.35
18 25 14
25 1 14
99 126 75
42 3 25
PC P E / C
P ( A) P ( E / A) P ( B ) P ( E / B ) P (C ) P ( E / C )
E 1 18
PC
3 33
1
3
1
3
14
25
25 1
42 3
14
108
0.33
18 25 14
14
99 126 75
25
6.10.
EJERCICIOS
CAPITULO VII
DISTRIBUCIONES DE PROBABILIDAD
f ( x)
Promedio: = np
Varianza : 2 = npq
SOLUCIN
N=8
S = H , M (Espacio muestral de acuerdo al sexo)
Entonces:
1
2
P(H)= p 1 / 2 0.5
P(M)=
1
p 1 / 2 0.5
2
a) X = 5
Reemplazando valores:
f (x )
8!
(0.5) 5 (0.5) 85
5! (8 5)!
f (x)
8* 7 * 6 * 5
(0.5) 5 (0.5) 85
5!3!
f ( x ) 56(0.03125
)(0.125)
f ( x ) 0.22
b) X = 6, 7, 8
f (x)
8!
8!
8!
(0.5) 5 (0.5) 85
(0.5) 7 (0.5) 87
(0.5) 8 (0.5) 88
6! (8 6)!
7! (8 7)!
8! (8 8)!
c) X = 0, 1, 2
f (x )
8!
8!
8!
(0.5) 0 (0.5) 80
(0.5)1 (0.5) 81
(0.5) 2 (0.5) 82
0! (8 0)!
1! (8 1)!
2! (8 2)!
SOLUCIN
alumnos desaprobados
q = 80% = 0.80 alumnos aprobados
p = 20% = 0.20
n = 12
a) x = 3
f (x)
12!
(0.20) 3 (0.80)123
3! (12 3)!
f ( x) 0.24
b) x = 10, 11, 12
f (x)
12!
12!
12!
(0.20)10 (0.80)1210
(0.20)11(0.80)1211
(0.2
10! (12 10)!
11! (12 11)!
12! (12 12)!
f ( x) 0.068719 0.206158
f ( x ) 0.2749
7.2.
DISTRIBUCIN DE POISSON
f ( x)
e x
,
x!
x =
0, 1, 2, 3
Donde:
= es el N promedio de ocurrencias del evento aleatorio dentro del intervalo
Varianza =
SOLUCIN
a)
2 ,
f ( x)
x=3
e x
x!
f (x) =
2.7183 2 2 3
3!
f(x) = 0.18
b) f ( x)
e x
x!
f(x) = 1 [
donde xi = 0,1,2
1!
2!
f(x) = 0.05
Para resolver este problema tambin se puede hacer uso de la tabla de la distribucin de
POISSON acumulada
EJEM 2.
Un lquido contiene ciertas bacterias cuyo promedio es de 4 por cm3. Hallar la probabilidad de
que no exista bacteria alguna:
a) En 0.5 cm3
b) En 1 cm3
SOLUCIN
4 por cm3 de liquido
0!
f (X = 0) =
f (X = 0) = 0.1353
b) En 1 cm3 4 ,
x=0
(2.7183) 4 ( 4)0
0!
f (X = 0) =
f (X = 0) = 0.0183
7.3.
DISTRIBUCIN NORMAL
0.5
0.5
u
Md
Me
donde
1
e
2
( x u )2
2 2
grfica). Ejm.
u1
u2
u3
u1 u2 u3
1 2 3
total.
El rea comprendida entre u 3
total.
La esperanza y la varianza de una variable aleatoria con distribucin normal es:
E ( x) u
V ( x) 2
xu
y haciendo u=0 y
1 , entonces:
f ( z)
1
e
2
z2
2
z
Para calcular el rea entre dos puntos Zo y Z1 es necesario calcular la siguiente integral:
Z1
Z0
1
e
2
z2
2 dz
Pero como existen tablas que proporcionan los resultados de las integraciones, no es
necesario realizar la integracin.
La tabla que utilizaremos nos da las reas bajo la curva normal a partir del centro de la
curva hacia la derecha y como la curva es simtrica para valores negativos de Z se
leern con valores positivos en la tabla correspondiente de la distribucin normal. (La
tabla se encuentra en el apndice
Ejem.
1.
a) Calcular: P(0 Z 2)
Graficamos la curva y marcamos los puntos Z=0 y Z=2 y luego sombreamos
el rea comprendida entre los dos puntos.
La tabla de la distribucin normal de una probabilidad de 0.4772.
Z 3
Z 2
Z 1
Z 0
Z 1
0.4772
Z 2
Z 3
Z 3
Z 2
Z 1
Z 0
Z 1
Z 2
0.39342
Z 3
0.4951
0.4951 0.3944 = 0.1007
c) Calcular P ( Z 1.45)
Z 3
Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.4265
0.5
Z 3
Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.3289
0.4842
0.4842 0.3289 = 1.1553
d) Calcular: P ( Z 2.25)
Z 3
Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.4878
0.5
a)
X = 120
Sabemos que Z
Z 3
Z 2Z 1 Z 0 Z 1
Z 2
0.4713
0.5
0.5 0.4713 = 0.0287
b) X = 115
Z 3
Z=
115 100
10.5
Z = 1.43
Z 3 Z 2
0.5
c) X1 = 114 y
z1 =
Z 1 Z 0
Z 3
0.5 + 0.42360.=4236
0.9236
X2 = 124
114 100
10.5
z1 = 1.33
Z 1Z 2
z2 =
124 100
10.5
z2 = 2.29
Z 3 Z 2 Z 1
Z 0
Z 1
0.4082
0.4890
Z 2
Z 3
fe
fe
Ejem. A un grupo de 132 alumnos se les ense la matemtica por tres mtodos I, II y
III. Por el mtodo I se enseo a 35 alumnos de los cuales 25 aprobaron. Por el mtodo II
se enseo a 47 alumnos, de los cuales 12 desaprobaron. Por el mtodo III se enseo a 50
alumnos , de los cuales 42 desaprobaron . Pruebe la hiptesis para verificar si los
mtodos de enseanza estn asociados al rendimiento de los alumnos. Utilice = 5%.
Solucin
Vamos ha elaborar la tabla de datos:
Mtodos de enseanza Aprobados
fo
25
35
42
102
I
II
III
TOTAL
fe
27.05
36.32
38.64
Desaprobados
Total
fo
10
12
8
30
35
47
50
132
fe
7.95
10.68
11.36
Hiptesis :
Ho: Los mtodos de enseanza no estn asociados al rendimiento de los alumnos
H1: Los mtodos de enseanza si estn asociados al rendimiento de los alumnos
Reemplazando en la formula:
2 =
25 27.05 2
27.05
35 36.32 2
36.32
...........
8 11.36 2
11.36
7.6. EJERCICIOS
1. Se lanza 5 veces una moneda . Cual es la probabilidad de obtener:
a. Exactamente 3 caras
b. Por lo menos 3 caras
c. A lo mas dos caras
2. Se lanza un dado 7 veces. Cual es la probabilidad de obtener exactamente 4 veces el
N 6.
3. Un estudio de las corrientes de carga en sistemas de alimentacin de computadoras en
instalaciones revel que el 10% de las instalaciones tenan razones de corriente neutral a
corriente de carga total altas. Se escoge una muestra aleatoria de 5 sistemas de
alimentacin de computadoras de un gran nmero de instalaciones , Que probabilidad
hay de que:
a. Exactamente tres tengan una relacin de corriente neutral a corriente de carga total
alta.
b. Por lo menos 3 tengan una relacin alta
c. Menos de 3 tengan una relacin alta.
4. Calcule la media, la varianza y la desviacin estndar de una variable aleatoria
binomial con n=20 y p = 0.6. Construya el intervalo 2.
5. El N de grietas por plancha de concreto hechas con cierto tipo de mezcla de
cemento tiene una distribucin de probabilidad de poisson aproximada. Adems , se
sabe que el N medio de grietas por plancha de concreto es 2.5.
a. Calcula la media y la desviacin estndar .
b. Cual es la probabilidad de que una plancha de concreto escogido al azar tenga
exactamente 5 grietas.
c. Calcule la probabilidad de que una plancha de concreto escogido al azar tenga dos o
ms grietas.
BIBLIOGRAFIA
1. Canavos, G. Probabilidad y Estadstica. Aplicaciones y Mtodos
McGraw Hill, 1992.
2. Bury, K. Distribuciones Estadsticas para Ingenieros, Cambridge
University Press, New York, 1999.
3. Devore, J. Estadstica y Probabilidad para Ingeniera y Ciencias
International Thomson Editores, 1998.
4. Hoog, R. y Craig, J. Introduction to Mathematical Statistics, Prentice
Hall, 1995.
5. Meyer, P., Probabilidad y Aplicaciones Estadsticas,
Addison Wesley