You are on page 1of 103

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

ESCUELA DE POST GRDO


MAESTRIA EN DOCENCIA UNIVERSITARIA E
INVESTIGACION EDUCATIVA

TALLER DE ESTADISTICA

MAG MAX CORREA CABANILLAS


.

CONTENIDO
CAPITULO I: BASE TEORICA DE LA ESTADISTICA

pag.

1.1.

Definicin de estadstica

1.2.

Poblacin

1.3.

Clases de poblacin

1.4.

Muestra

1.5.

Unidad de anlisis

1.6.

Dato estadstico

1.7.

Informacin

1.8.

Indicador

1.9.

Parmetro

1.10. Estadgrafo

1.11. Variable

1.12. Clasificacin de las variables

1.12.1. Por su naturaleza

1.12.2. De acuerdo a la funcin que desempea en un problema de investigacin 4


1.13. Escalas de medicin

1.14. Clasificacin de la estadstica

CAPITULO II: PRESENTACION DE DATOS

2.1. Encuesta

2.2. Tablas estadsticas

10

2.2.1. Cuadros estadsticos

10

2.2.1.1. Partes de un cuadro estadstico

10

2.2.1.2 Tipos de cuadros estadsticos

10

2.2.2. Tablas de distribucin de frecuencias

14

2.2.2.1. De variable discreta

14

2.2.2.2. De variable continua

17

2.3. Representaciones grficas

21

2.3.1. Construccin de Grficos

21

2.3.2. Partes de un grfico

21

2.3.3. Tipos de grficos.

21

2.4. Ejercicios

27

CAPITULO III: MEDIDAS DE TENDENCIA CENTRAL

29

3.1.

Medidas de Centralizacin

30

3.2.

El Promedio

30

3.2.1. Promedio para datos originales

30

3.2.2. Promedio para datos tabulados

30

La Moda

32

3.3.1. Moda para Datos Cuantitativos

32

a. Moda para datos Originales

32

b. Moda para datos Tabulados

32

3.3.

3.3.2. Moda para datos Cualitativos


3.4. La Mediana
3.4.1. Mediana para Datos Cuantitativos

34
35
35

a. Mediana para datos originales

35

b. Mediana para datos tabulados

36

3.4.2. Mediana para datos Cualitativos


3.5. Cuartiles

40
41

a. Cuartiles para datos Originales

42

b. Cuartiles para datos Tabulados

44

3.6. Medidas Descriptivas de Resumen Utilizando Cuartiles

46

3.6.1. El Eje Medio

46

3.6.2. Rango Intercuartilico

47

3.7. Diagrama de Bloques y Lneas

47

3.8. Deciles

48

a. Deciles para datos Originales

48

b. Deciles para Datos Tabulados

49

3.9. Percentiles

50

3.10. Tasas de crecimiento

51

3.11. La Media Geomtrica

51

3.11.1. Media Geomtrica Simple

51

3.11.2. Media Geomtrica Ponderada

52

CAPITULO IV: MEDIDAS DE DISPERSION

54

4.1. Medidas de dispersin

55

4.2. Recorrido o Rango

55

4.3. La Varianza

55

4.3.1. Varianza para Datos Originales

55

4.3.2. Desviacin Estndar

56

4.3.3. Varianza para datos tabulados

56

a. Para datos tabulados no agrupados en intervalos

56

b. Para datos tabulados agrupados en intervalos

57

4.3.4. Propiedades de la varianza

58

4.4. Coeficiente de variacin

58

4.5. Medidas de Asimetra

59

4.6. Estadgrafos de apuntamiento

60

CAPITULO V: DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES 61


5.1. Generalidades

62

5.2. Distribucin de Frecuencias Bidimensionales de Variable Discreta

62

5.3. Distribucin de Frecuencias Bidimensionales de Variable Continua- Discreta69


5.4. Ejercicios.

72

CAPITULO VI: PROBABILIDADES

73

6.1.

Experimento Aleatorio

74

6.2.

Punto muestral

74

6.3.

Espacio Muestral

74

6.4.

Suceso o evento

74

6.5.

Sucesos Mutuamente Excluyentes

74

6.6.

Sucesos complementarios

74

6.7.

Definicin de Probabilidad

74

6.8.

Definicin

75

6.9.

Reglas de Probabilidad

75

6.10. Ejercicios

80

CAPITULO VII: DISTRIBUCIONES DE PROBABILIDAD

82

7.1. Distribucin Binomial

83

7.2. Distribucin de Poisson

85

7.3. Distribucin Normal

87

7.4. Distribucin Normal Estndar

89

7.5. Distribucin Chi- Cuadrado

95

7.6. Ejercicios

96

CAPITULO I: BASE TEORICA DE LA ESTADSTICA

1.1. DEFINICION DE ESTADISTICA:


Es la ciencia que nos proporciona los mtodos ms eficientes para la recoleccin,
organizacin, presentacin, anlisis e interpretacin de un conjunto de datos, con la
finalidad de describirlos o de realizar generalizaciones vlidas mediante tcnicas
adecuadas.
1.2. POBLACION
Viene a ser el conjunto de personas, animales u objetos que poseen una o ms
caractersticas comunes observables de naturaleza cualitativa o cuantitativa que se
pueden medir en ellos. La poblacin est integrada por la totalidad de unidades de
anlisis. Una poblacin debe estar definida en el espacio y en el tiempo.
Ejemplo: Alumnos del Ciclo 2005-I, de la Facultad de Ciencias Fsicas y
Matemticas de la U.N.P.G.
1.3. CLASES DE POBLACION
Se tiene dos clases de poblacin:
1.3.1. POBLACION FINITA
Es aquella que tiene un nmero limitado de elementos.
1.3.2. POBLACION INFINITA
Es aquella que tiene un nmero ilimitado de elementos.
Generalmente en las investigaciones no se conoce el nmero de elementos
de la poblacin.
1.4. MUESTRA
Una muestra viene a ser una pequea parte de la poblacin y que se utiliza para
estudiar las caractersticas de la misma.
Una muestra se usa por dos razones: mayor economa y menor tiempo en la
realizacin de la investigacin.
Generalmente las poblaciones de estudio son grandes lo cual dificulta la
investigacin, en consecuencia se utiliza una muestra como medio de estudio.

Una muestra debe ser seleccionada de tal manera que sea representativa de la
poblacin.
1.5. UNIDAD DE ANALISIS
Viene a ser cada elemento que ser estudiado en un poblacin, sobre los cuales se
va a obtener datos.
En el ejemplo anterior, la unidad de anlisis viene a ser cada alumno.
1.6. DATO ESTADISTICO
Es el resultado de medir una caracterstica observable de una unidad estadstica
1.7. INFORMACION
Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay
informacin sin datos.
1.8. INDICADOR
Es una cantidad o valor que permite conocer el estado de un hecho. Son elementos
caractersticos que describen una situacin permitiendo su anlisis. Como ejemplo
de indicador tenemos a las Tasas, medidas de resumen, etc.
1.9. PARAMETRO
Se denomina parmetro a una medida descriptiva que resume una caracterstica de
la poblacin, tal como la media () o la varianza (2), calculada a partir de los
datos observados en la poblacin.
1.10. ESTADIGRAFO
Se denomina estadgrafo a una medida descriptiva que resume una caracterstica de
la muestra, tal como la media ( X ) o la varianza (S 2)calculada a partir de los datos
observados de una muestra.

1.11. VARIABLE
Es una caracterstica que puede tomar diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser
expresadas en varias categoras.
La variable adquiere un valor determinado en cada unidad de anlisis y que puede
ser medido o cuantificado.
1.12. CLASIFICACION DE LAS VARIABLES
1.12.1 De acuerdo a su naturaleza: las variables de clasifican en:
a. CUALITATIVAS:
Son aquellas que se expresan mediante palabras y pertenecen a una de varias
categoras que mutuamente se excluyen. Ejemplo: Sexo, Estado Civil,
Niveles de desnutricin, Grado de instruccin, Zona de residencia, etc.
b. CUANTITATIVAS:
Son aquellas que se expresan numricamente y dan origen a dos tipos de
variables:
b.1. Variable Discreta:
Es aquella que toma valores enteros o especficos. Ejemplo: Nmero de
alumnos, Nmero de docentes, nmero de trabajadores de una empresa,
etc.
b.2. Variable Continua:
Es aquella que puede tomar cualquier valor dentro de un intervalo dado.
Ejemplo: Ingreso econmico, Edad, Talla, peso, Tiempo, etc.
De acuerdo a la funcin que desempean en el planteamiento de un problema de
investigacin:
a. Variable Independiente: Es la variable explicativa.
b. Variable Dependiente : Es la variable explicada
1.13. ESCALAS DE MEDICION
Se denomina escala de medicin a un instrumento de medida que sirve para
cuantificar las variables.
La escala de medida orientar al investigador para el anlisis estadstico que podr
realizar. Entre las escalas de medicin se tiene:

1. ESCALA NOMINAL
Es aquella que tiene como funcin clasificar las categoras de la variables.
Ejemplo: la variable Sexo asigna a las personas dos categoras o modalidades:
masculino y femenino. Las variables Estado civil, Ocupacin, tienen
categoras o modalidades que son de escala nominal.
2. ESCALA ORDINAL
Es aquella que tiene como funcin clasificar y ordenar las categoras de las
variables en forma ascendente o descendente.
Ejemplo: Grado de instruccin, con sus modalidades: Primaria, Secundaria,
Superior.
Estatus Socioeconmicos, con sus modalidades: bajo, medio y alto.
3. ESCALA DE INTERVALO
Es aquella que tiene como funcin clasificar, ordenar, se puede conocer la
distancia entre dos puntos cualesquiera y adems tiene un punto cero relativo
como punto de partida.
Ejemplo: la temperatura, si utilizamos las escala centgrada, esta empieza en
cero, pero si utilizamos la escala Fahrenheit, esta empieza en 32 grados. Como
otros ejemplo tenemos las calificaciones de un test, la medicin de actitudes, etc.
4. ESCALA DE RAZON
Tiene como funcin clasificar, ordenar, se puede conocer la distancia entre dos
puntos y nos permite realizar las cuatro operaciones, adems tiene un punto
cero absoluto como punto de partida. En esta escala se puede establecer
relaciones de igualdad. Los valores de esta escala se obtienen en general por
mediciones. Ejemplo: Talla, Peso, Edad, Ingresos econmicos, volumen, etc.
1.14.

CLASIFICACION DE LA ESTADISTICA:

De acuerdo a las funciones que realiza la estadstica se clasifica en:

1.14.1. ESTADISTICA DESCRIPTIVA


Es aquella que utiliza un conjunto de mtodos estadsticos con la finalidad de
describir (Tablas estadsticas, grficos) y analizar (Medidas de resumen)
datos. La estadstica descriptiva es aplicable a nivel de la poblacin o a nivel
de la muestra.
La estadstica descriptiva no intenta realizar generalizaciones.
1.14.2. ESTADISTICA INDUCTIVA O INFERENCIAL
Es aplicable a nivel de muestra y su funcin es generalizar las caractersticas
observadas en la muestra hacia la poblacin. Es decir las conclusiones
obtenidas a partir de una muestra, son validas para toda la poblacin. La
inferencia puede contener conclusiones que pueden no ser ciertas en forma
absoluta, por lo que es necesario que stos sean dados con una medida de
confiabilidad que es la probabilidad.
Estas dos clases de estadstica no son mutuamente excluyentes, ya que para utilizar
los mtodos de la inferencia estadstica, se requiere conocer los mtodos de la
estadstica descriptiva.

CAPITULO II: PRESENTACION DE DATOS

2.1.

ENCUESTA: Es un instrumento que sirve para la recoleccin de


datos en un trabajo de investigacin por observacin.
Una encuesta se elabora teniendo en cuenta los objetivos de
estudio, consecuentemente debe contener las variables de inters.
La siguiente ilustracin tuvo como objetivo, identificar los factores
socioeconmicos y culturales de los padres de familia relacionados
con el rendimiento de sus hijos. La encuesta es la siguiente:

DISEO DE LA ENCUESTA
Nota: La Encuesta ser respondida por el responsable de la familia.
1. Nombres:..

apellidos:..............................................................................................
2. Anote

el

ciclo

de

estudios

de

su

hijo: .......................................................................
3. Indique su Estado Civil:
a. Casado (a)

( )

c. Separado (a)

( )

b. Conviviente

( )

d. Divorciado (a)

( )

e. Viuda

( )

f. Madre Soltera

( )

4. Indique La Zona donde reside:


a. Zona Urbana.

( )

b. Zona Urbano Marginal

( )

c. Zona Rural

( )

5. Aspectos Relacionados con la Vivienda:


a. Su vivienda es: 1) Propia

( )

2. Alquilada ( )

3) Otras Formas:...................................
b. Indique

cuantas

habitaciones

tiene

vivienda:..........................................
c. En su vivienda existe un ambiente de estudio para su hijo?
Si

( )

No

( )

6. Cuntos hijos tiene?:.............................................

su

7. Indique cual es su ocupacin:


a. Empleado (a)

( )

d. Ama de casa

( )

b. Obrero

( )

e. Otras

( )

c. Trabajador (a) independiente ( )


8. Indique cual es su ingreso econmico familiar mensual:
a. Menos de 500 soles

( )

b. de 500 a 700 soles

( )

c. de 701 a 900 soles

( )

d. de 901 a 1100 soles

( )

e. Ms de 1100 soles

( )

9. Cul es la disponibilidad econmica diaria del estudiante?


a. Un sol

( )

b. Dos Soles

( )

c. Tres Soles

( )

d. Ms de tres Soles ( )
10. Indique su nivel de instruccin
a. Iletrado (a)

( )

b. Primaria

( )

c. Secundaria

( )

d. Superior No Universitaria

( )

e. Superior Universitaria

( )

11. Cuntas horas diarias en promedio dedica al estudio su hijo?


a. < 1 hora

( )

b. 1 a 2 horas

( )

c. 2.1 a 3 horas

( )

d. Ms de 3 horas

( )

12. Cul fue el rendimiento promedio de su hijo, en el ciclo anterior? (esta


nota ser proporcionada por el profesor, del registro de notas)
a. 0 a 10

( )

b. 11 a 15

( )

c. 16 a 20

( )

2.2.

TABLAS ESTADISTICAS: Sirven para presentar los datos


estadsticos en filas y columnas, clasificados de acuerdo a las
categoras o indicadores de las variables.
Metodolgicamente las tablas estadsticas se clasifican en:
Cuadros Estadsticos y tablas de distribucin de frecuencias .

2.2.1. CUADROS ESTADISTICOS: Son arreglos ordenados en filas y


columnas de datos estadsticos de acuerdo a las variables de estudio,
para su interpretacin y anlisis. Los cuadros estadsticos se elaboran
para presentar los informes de trabajos de investigacin.
Los cuadros estadsticos se disean teniendo en cuenta los objetivos
especficos de la investigacin.
2.2.1.1. PARTES DE UN CUADRO ESTADISTICO: En general se consideran
las siguientes partes:
a. NUMERO: Es el cdigo de identificacin que permitir la ubicacin del
cuadro.
b. LUGAR: Se refiere al lugar donde se realiz el trabajo de
investigacin
c. TITULO: Indica una descripcin resumida del contenido de la tabla y
contendr la variable o variables de estudio consideradas en la tabla.
d. CUERPO DEL CUADRO: En esta parte se registrar los datos
producto del procesamiento de las encuestas.
e. FUENTE: Se considerar cuando los datos se hayan obtenido de
alguna entidad o publicacin. Cuando son datos obtenidos directamente
por el investigador (datos de primera mano), no se consignar fuente.
2.2.1.2. TIPOS DE CUADROS ESTADISTICOS:
a. De Variable Cualitativa: Los ms usuales son:
a.1. Cuadros Unidimensionales: Se construyen cuando se analiza una
sola variable cualitativa ( Estado Civil, Zona de Residencia,
Ocupacin, etc.).

Ejem.
CUADRO N 1
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO
SEGN GRADO DE INSTRUCCIN

NIVEL DE INSTRUCCIN

Primaria

2.86

Secundaria

11

15.71

Sup. No Universitaria

42

60.00

Sup. Universitaria
Total

15
70

21.43
100.00

a.2. CUADROS BIDIMENSIONALES: Llamados tambin de doble


entrada, se construyen cuando se analiza a la vez dos variables
cualitativas. Ejem.
CUADRO N 2
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO POR ZONA DE
RESIDENCIA Y NIVEL DE INSTRUCCIN

NIVEL DE INSTRUCCION
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
TOTAL

ZONA DE RESIDENCIA
Urbana
Urbano
Rural
N
3
26
12
41

%
4.29
37.14
17.14
58.57

Marginal
N
%
1
1.43
6
8.57
13
18.57
3
4.29
23
32.86

N
1
2
3
6

%
1.43
2.85
4.29
8.57

TOTAL
N
%
2
2.86
11 15.71
42 60.00
15 21.43
70 100.00

Tambin existen cuadros tridimensionales, estos dependen de la naturaleza de


los trabajos de investigacin.

b. DE VARIABLE CUANTITATIVA:
b.1. CUADROS UNIDIEMNSIONALES:
Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos
econmicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.
CUADRO N 3
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO
INGRESO

ECONOMICO

INGRESO ECONOMICO

b.2.

SEGN

500

700

7.14

701

900

11.43

901

1100

15

21.83

1101 - 1300

25

35.71

1301 - 1500
TOTAL

17
70

24.29
100.00

CUADROS BIDIMENSIONALES: Se construyen cuando se

analizan a la vez dos variables cuantitativas. Ejem.

CUADRO N 4
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGN

INGRESO ECONOMICO Y RENDIMIENTO DE LOS ALUMNOS


Ingreso
0 -10

Econmico
500 - 700
701 - 900
901 - 1100
1101-1300
1301-1500
Total

Rendimiento
11-15

N
3
2
4
4
2
15

%
4.29
2.86
5.71
5.71
2.86
21.43

N
2
5
8
21
14
50

16-20

%
2.85
7.14
11.43
30.0
20.0
71.42

N
1
3
1
5

%
1.43
4.29
1.43
7.15

Total
N
5
8
15
25
17
70

%
7.14
11.43
21.43
35.71
24.29
100

c. DE VARIABLE CUANTITATIVA- CUALITATIVA: Se construyen cuando se


analiza una variable cuantitativa y una cualitativa. Ejem.
CUADRO N 5
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGN
INGRESO ECONOMICO Y ZONA DE RESIDENCIA

Urbana

Ingreso
Econmico
500 - 700
701 - 900
901 - 1100
1101- 1300
1301- 1500
Total

N
2
9
18
12
41

Zona de Residencia
Urbano

%
2.86
12.86
25.71
17.14
58.57

marginal
N
%
1
1.43
4
5.71
6
8.57
7
10
5
13.15
23 32.86

Rural

N
4
2
6

%
5.71
2.86
8.57

Total
N
5
8
15
25
15
70

2.2.2. TABLAS DE DISTRIBUCION DE FRECUENCIAS:


SIMBOLOGIA:
n

N de datos

Li

Lmite inferior de los datos

Ls

Lmite superior de los datos

Recorrido o rango

N de intervalos

amplitud intervlica

%
7.14
11.43
21.43
35.71
24.29
100.00

Xi

Recorrido o valores que toma una variable discreta

ni

Frecuencias absolutas

hi

Frecuencias relativas

Ni

Frecuencias absolutas acumuladas

Hi

Frecuencias relativas acumuladas

hix100:

Frecuencias relativas porcentuales

Hix100:

Frecuencias relativas porcentuales acumuladas

[yi-1 yi): Intervalo cerrado por la izquierda y abierto por la


derecha
(yi-1 yi]: Intervalo abierto por la izquierda y cerrado por la
derecha
[yi-1 yi]:
2.2.2.2

Intervalo cerrado por ambos lados

DISRIBUCION DE FRECUENCIAS DE VARIABLE


DISCRETA:
Ejem : Los siguientes datos corresponde al nmero de

profesores de de 75 colegios:
49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49,
51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49,
47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48,
50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51,
52, 48, 51
a. Elabore una tabla de frecuencias para analizar los datos.
b. Interprete la tabla
Solucin
TABLA N 6
DISTRIBUCION DE FRECUENCIAS DE LOS
PROFESORES DE 75 COLEGIOS

Xi

ni

hi

Ni

Hi

hix100

Hix100

46

0.11

0.11

11

11

47

10

0.13

18

0.24

13

24

48

16

0.21

34

0.45

21

45

49

14

0.19

48

0.64

19

64

50

12

0.16

60

0.80

16

80

51

0.12

69

0.92

12

92

52

0.08

75

1.00

100

75

1.00

100

PROCEDIMIENTO
En la primera columna se colocan los valores que toma la
variable
Xi .
Las frecuencias absolutas ni, resultan de contar cuantas veces
se repite los valores que toma la variable, es decir, cuantas
veces se repite el 1, cuantas veces se repite el dos, etc.
Las frecuencias relativas hi, resultan de dividir cada frecuencia
absoluta entre el total de datos (80).
La frmula para encontrar cada frecuencia relativa es hi
lo que resulta: h1
h1

n1
n
n
; h2 2 ; h3 3 ; etc.
n
n
n

8
0.11
75

h2

10
0.13
75

- Frecuencias Absolutas Acumuladas Ni: Se calculan as:


N 1 n1 N 1 8
N 2 n1 n 2 N 2 8 10
N 3 n1 n 2 n3

N 2 18

N 3 8 10 16 34

As sucesivamente.

N 3 34

ni
, de
n

- Frecuencias Relativas Acumuladas Hi: Se calculan as de


manera similar:
H 1 h1

H 2 h1 h2

H 1 0.11

H 2 0.11 0.13 0.24

H 3 h1 h2 h3

H 3 0.11 0.13 0.21

H 2 0.24
H 3 0.45

- Frecuencias Relativas Porcentuales (hi x 100): Se encuentran


multiplicando por 100 a cada frecuencia relativa simple (hi):
h1x 100 = 0.11 x 100 = 11
h2x 100 = 0.13 x 100 = 13
h3x 100 = 0.21 x 100 = 21
y as sucesivamente.
- Frecuencias Relativas Porcentuales Acumuladas(Hix100): Se
encuentran multiplicando por 100 a cada frecuencia relativa
acumulada (Hi):
H1x 100 = 0.11 x 100 = 11
H2x 100 = 0.24 x 100 = 24
H3x 100 = 0.45 x 100 = 45
y as sucesivamente.

INTERPRETACIN DE LOS VALORES DE LA TABLA


Vamos a interpretar dos valores de cada columna, el resto de
valores se interpreta de manera similar.
n3 = 16

16 colegios tienen 48 profesores

n5 = 12

12 colegios tienen 50 profesores

h2 = 0.13

El 0.13 por uno de colegios tienen 47


profesores

h4 = 0.19 :

El 0.19 por uno de colegios tienen 49

profesores
N3 = 34

34 colegios tienen de 46 a 48
profesores

N6 = 69

69 colegios tienen de 46 a 51
profesores

H3 = 0.45

El 0.45 por uno de colegios tienen de


46 a 48 profesores

H5 = 0.80

El 0.80 por uno de colegios tienen de


46 a 50 profesores

h4 x 100 = 19

El 19% de colegios tienen 49


profesores

h6 x 100 = 12

El 12% de colegios tienen 12


profesores

H3 x 100= 45

El 45% de colegios tienen de 46 a 48


profesores

H5 x 100= 80

El 80% de colegios tienen de 46 a 5o


profesores

2.2.2.3. DISRIBUCIN DE FRECUENCIAS DE VARIABLE


CONTINUA:
Cuando la variable en estudio es continua los datos se
agrupan en intervalos.
Ejem. Los siguientes datos corresponde al ingreso
econmico de 62 trabajadores.
910, 950, 1190, 620, 1040, 1100, 1070, 925, 800, 1380,
780, 456, 706, 1100, 860, 1370, 1240, 1120, 1020, 1060,
930, 1136, 1180, 990, 630,1070, 930, 1200, 920, 815, 495,
480, 460, 1090, 1220,456, 742, 1080, 1082, 1073, 1345,
790, 950,1073, 1170, 790, 1085, 820, 900, 780, 700, 650,
1020, 980, 950, 990, 935, 810, 790, 1382, 1384, 910

a. Elabore una tabla de distribucin de frecuencias


utilizando un intervalo cerrado por la izquierda y abierto
por la derecha.
b. Interprete la tabla y haga la representacin grafica
correspondiente
TABLA N 7

[yi-1-yi)
454.5 - 587.5

yi
521

ni
5

hi
0.08

Ni
5

Hi
0.08

hix100
8

Hix100
8

587.5 720.5

654

0.08

10

0.16

16

720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
TOTAL

787
920
1053
1186
1319

10
13
16
8
5
62

0.16
0.21
0.26
0.13
0.08
1.00

20
33
49
57
62

0.32
0.53
0.79
0.82
1.00

16
21
26
13
8
100

32
53
79
82
100

PROCEDIMIENTO.
1. Para construir

los intervalos se puede proceder de dos

maneras:
a. Por Conveniencia: De acuerdo a la naturaleza del trabajo
de investigacin y en funcin a la utilidad de informacin
que le pueda brindar al investigador, se pueden construir
los intervalos. No necesariamente los intervalos deben
tener la misma amplitud.
b. Metodologa para Construir los Intervalos: Existe una
metodologa que se utiliza

para construir los intervalos

para una tabla de frecuencias de variable continua.


1 Se determina el Rango, con la siguiente frmula:
R Ls Li

R = Ls Li = 1384-456 = 928 R = 928


2 Se determina el nmero de intervalos:
m 2 .5

m = 2.5

4 62

m=7
3 Se determina la amplitud del intervalo ( c ):
C=

R 928

132.5714286
M
7

Si el valor de C, sale con muchos decimales es preferible hacer


ampliacin de los lmites de la informacin con la finalidad de no
tener problemas a la hora de construir los intervalos. Si esto
ocurre, la tabla se construir con los nuevos lmites obtenidos.
La ampliacin de los lmites de los datos se hace, agregando al
lmite superior de los datos una cantidad pequea y restando la
misma cantidad al lmite inferior de los datos. Se debe ir
probando con varias cantidades ( 0.25, 0.50, 0.75, 1, 1.25. 1.50,
1.75, 2, etc). No necesariamente se busca que el valor de C sea
entero. Para nuestro caso la solucin es agregar al lmite
superior de los datos 1.5 y restar esta misma cantidad al lmite
inferior, con lo que tendramos los nuevos lmites de las datos:
Ls = 1385.5 y Li = 454.5, por diferencia de ambos valores se
tiene R = 931, entonces el valor de la amplitud sera
C=

931
133
7

Para construir los intervalos de la tabla, se empieza del lmite


inferior modificado y se va agregando el valor de la amplitud ( C=
133), hasta llegar al lmite superior de los datos. Posteriormente,
con la finalidad de tener intervalos cerrados, a partir del segundo
intervalo, se va agregando un dcimo al lmite inferior del
intervalo. .
2. PUNTOS MEDIOS DEL INTERVALO: Los puntos medios de
los intervalos se encuentran, sumando el lmite inferior ms el

lmite superior del mismo y luego se divide entre 2. Ejemplo:


454.5 587.5
587.5 720.5
521 ;
654 , etc.
2
2

3. Las frecuencias se encuentran de la misma manera que en la


tabla

de

distribucin

para

variable

discreta,

descrita

anteriormente.
Para la interpretacin de los valores de la tabla se procede de
manera similar que se hizo para la tabla de frecuencia de
variable discreta (Tabla anterior).
.Como ejemplo interpretaremos algunos valores:
n4 = 13: 13 trabajadores tienen un ingreso de 853.5 a 986.5
soles.
n3=10 Vrs. Y3=787: 10 trabajadores tienen un ingreso promedio
de
787 soles.
h5=0.24: El 0.24 por uno de trabajadores tienen un ingreso de
986.5

a 1119.5 soles.

N4=33 : 33 trabajadores tienen un ingreso de 454.5 a 986.5


soles.
H5 = 0.77: El 0.77 por uno de trabajadores tienen un ingreso de
454.5 a 1119.5 soles.
h3x100=16: El 16 % de trabajadores tienen un ingreso de 720.5 a
853.5 soles.
H6x100=90 : El 90 % de trabajadores tienen un ingreso de 454.5
a

2.3.

1252.5 soles.

REPRESENTACIONES GRAFICAS
Un grfico es un medio para representar de manera objetiva los datos de
una tabla estadstica. Los grficos se elaboran en funcin del tipo de
variable que se quiere representar.

2.3.1

CONSTRUCCION DE GRAFICOS:
Existen una diversidad de grficos, cuya forma depender de las variables
de estudio y de los objetivos de estudio.
Los grficos de una sola variable sirven para fines comparativos de cifras
absolutas o porcentuales y pueden tener la forma de barras, superficies o
lneas.
Los grficos de dos variables se construyen en el plano de coordenadas
cartesianas.

2.3.2. PARTES DE UN GRAFICO:


a. Titulo: Indica la naturaleza del fenmeno representado.
b. Diagrama: Representa los datos contenidos en la tabla estadstica
c. Escalas : Las escalas se construyen de acuerdo a la magnitud de las
frecuencias.
d. Fuente: Sirve para indicar la fuente de los datos representados, esto es
opcional puesto que la fuente se especifica en la tabla estadstica de
donde provienen los datos.
2.3.3. TIPOS DE GRAFICOS: Entre los principales se tiene:
a. Grficos de rea o de Superficie: Se construyen para una variable de
cualitativo. Para la ilustracin tomaremos los datos del Cuadro N 1

b. Grfico de Barras: Se construyen para dos variables de tipo cualitativo. Para su


ilustracin tomamos los datos del cuadro N 2.

a. Grfico de Bastones: Se construyen para variables de tipo discreto.


Para la ilustracin tomaremos los datos de la tabla N 6

b. Histograma de Frecuencias:
Se construye para variables de tipo cuantitativo y consiste en barras
que van unidas. Para la ilustracin tomaremos los datos de la tabla
N 7.

c. Grficos para Series de Tiempo: Se denomina series de tiempo a los


datos ordenados en funcin del tiempo: ejemplo:
AOS N de Alumnos de la Facultad
1998

De Ing. Informtica y Sist.


380

1999

450

2000

530

2001

600

2002

690

2003

770

2004

855

EJERCICIOS
1. La inversin mensual en compra de computadoras, en miles de dlares, por 48
pequeas empresas fue:
31 17 27 20 28 10 34 25 14 24 40 35 15 39 18 30 41 26
12 46 18 23 36 19 29 37 33 27 27 24 26 31 32 28 25 28
33 28 22 23 31 29 35 21 30 25 38 31.
a. Construir una tabla de frecuencias para analizar los datos, considerando un
intervalo
abierto por la derecha y cerrado por la izquierda. Interprete.
b. Determinar el N de empresas con una inversin menor a 25 mil dlares.
c. Determinar el porcentaje de empresas con una inversin entre 14 mil y 20 mil
dlares.
2. Con los datos del problema N 1, elabore una tabla de frecuencias utilizando un
intervalo cerrado por ambos lados. Interprete la tabla.
3. Los siguientes datos corresponde a las notas en el curso de estadstica de 52
alumnos:
12 11 12 12 7 8 12 12.5 9.5 9 9 12 7.5 12.5 10 9 11.5 13
10.5 10 12 8 14 12 11 16 12 15 9 10.5 12 12 10 13.5 12 18
10 11 10 17 12.5 10.5 14 11 10.5 14.5 12.5 11.5 12 13 11 11.5
.
Construir una tabla de frecuencias utilizando intervalos cerrados por ambos
lados. Interprete la tabla y haga la representacin grfica correspondiente.
4. Los siguientes datos corresponde al N de libros de estadstica consultados por
50
estudiantes para rendir su primer examen parcial.
2 3 4 4 0 4 0 2 1 1 0 3 0 2 2 0 3 0 4 1 0 1 2 0 1 1
5
0 5 0 3 2 0 5 4 1 1 0 4 2 1 1 4 6 2 1 2 3 0 3.
Construir una tabla de frecuencias e interprete la tabla.
5. Con respecto a la tabla de frecuencias del problema anterior se pide:
a. Qu porcentaje de alumnos consult de 4 a 6 libros?
b. Qu porcentaje de alumnos no consult ningn libro?
c. Qu porcentaje de alumnos consult hasta 3 libros?

6. La demanda diaria de azcar durante 190 das en un supermercado, se tabul en


una
distribucin de frecuencias simtrica de 5 intervalos de amplitudes

iguales a 4. Si la marca de clase del intervalo central es igual a 12 y si la curva de


frecuencias absolutas satisface la relacin :
f ( x ) = - ( x 12 ) 2 + 70 . Reconstruir la distribucin y graficar.
7. Los siguientes datos corresponde a las calificaciones de 60 alumnos de un curso de
matemticas: H4 x 100 = 85 ; H3 x 100 = 70 y H2 x 100 = 60 ; el lmite inferior del
2 intervalo es 5 y el lmite inferior del tercer intervalo es 9 . Complete la tabla de
frecuencias. Interprete la tabla.
8. Los siguientes datos corresponde al peso en libras de 56 trabajadores de una empresa:
167 154 134 175 184 158 175 120 115 125 136 146 148 134
126 143 178 163 152 134 145 168 129 132 118 154 115 127
135 167 183 174 156 162 165 169 170 154 160 145 134 156
166 145 134
123 145 167 156 133 155 143 166 148 125 153.
Construir una tabla de frecuencias utilizando intervalos cerrados por ambos
lados. Interprete la tabla de frecuencias y haga el grafico correspondiente.
9. Los siguientes datos corresponde a 64 de alumnos del curso de matemticas de los
cuales 25 son mujeres, 42 del curso de estadstica, de los cuales 12 son mujeres y
32 del curso de computacin I , de los cuales 18 son mujeres. Haga una tabla para
presentar los datos y grafique.
10. Complete la siguiente tabla de distribucin de frecuencias, correspondiente a las
calificaciones de 60 alumnos del curso de estadstica.
Yi-1-Yi
05
09

Hi x100

ni
12

Yi

hi
0.20

Ni

Hi

hix100

60
70
85

Totales
11. El peso en gramos de 30 objetos de un mismo tipo son los siguientes : 21.3 15.8
18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8 22.7 18.0 20.5 11.0 18.5
23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
a. Construir una tabla de frecuencias de 6 intervalos de clase.
b. Calcular el porcentaje de objetos cuyo peso sea 21.5 gr. o ms.
c. Calcular el peso debajo del cual se encuentran el 25% de los objetos.
13. Las puntuaciones de un tes aplicado a un grupo de trabajadores de una empresa
se tabularon en una distribucin de frecuencias de 6 intervalos de igual amplitud. La
marca de clase del segundo intervalo es 25 y el lmite superior del quinto intervalo es
60, si las 4 primeras frecuencias relativas porcentuales son respectivamente de 15,
20, 35 y 14 y si el 94% de las puntuaciones son menores que 60. Elabore la tabla de
frecuencias e indique el porcentaje de trabajadores que tienen entre 38 y 53 puntos.

CAPITULO III

MEDIDAS DE TENDENCIA CENTRAL PARA


EL ANALISIS DE LOS DATOS

MEDIDAS DE CENTRALIZACIN
Las Medidas de Centralizacin o de Tendencia Central son parmetros estadsticos que
expresan en forma resumida un conjunto de datos. Estos parmetros a travs de sus
propiedades y sus definiciones hacen posible el anlisis de un conjunto de datos.
3. EL PROMEDIO O MEDIA ARITMTICA
3.1. PROMEDIO PARA DATOS ORIGINALES: Se denomina datos originales a
un conjunto de datos de cualquier variable y copiados de cualquier manera. La
frmula para su clculo es:
n

xi

Donde xi: Observaciones o Datos

i 1

n: N de datos

Ejemplo: Los siguientes datos corresponde al ingreso de 8 padres de los alumnos de


ingeniera Informtica: 1200, 900, 1250, 1350, 800, , 750, 1200, 1300. Encontrar el
ingreso promedio
x

1200 900 1250 1350 800 750 1200 1300


8

x 1093.75

soles

El ingreso econmico promedio de 8 padres de familia es 1093.75 soles.

3.2. PROMEDIO PARA DATOS TABULADOS


3.2.1 Promedio para datos tabulados no agrupados en intervalos (Variable
Discreta)
n

FORMULA:

x i ni
i 1

Ejemplo: Se tomarn los datos de la tabla N 6


Xi
46
47
48
49
50
51
52
Total

ni
8
10
16
14
12
9
6
75

Reemplazamos los valores en la frmula:


46 x8 47 x10 48 x16 49 x14 50 x12 51x 9 52 x 6
75
x 48.84
x

El N promedio de trabajadores por empresa es aproximadamente 49


3.2.2. Promedio para datos tabulados agrupados en intervalos (Variable
Continua)
n

FORMULA:

y i ni
i 1

yi : Puntos medios del

intervalo
Ejemplo: Se tomarn los datos de la tabla N 7
Ingreso
Econmico
454.5 - 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

yi

ni

521
654
787
920
1053
1186
1319

5
5
10
13
16
8
5
62

521x5 654 x5 787 x10 920 x13 1053 x16 1186 x8 1319 x5
62
y 945.74
y

El ingreso econmico promedio de los 80 padres de familia es de 950.03 soles.


3.2. LA MODA (Md)
La Moda en un conjunto de observaciones, viene a ser el valor de la
variable que se presenta con ms frecuencia en la distribucin de datos
3.2.1. MODA PARA DATOS CUANTITATIVOS:
2.1.1. Moda para Datos Originales
Ejemplo N 1: Los siguientes datos corresponde a los ingresos econmicos
de 10 padres de familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
La moda es: Md = 1040
Ejemplo N 2: Ingresos econmicos de 8 trabajadores. Encontrar la moda.
1200, 1050, 1200, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.
Ejemplo N 3: corresponde a los pesos de 10 alumnos:
65, 54, 72, 60, 58, 54, 66, 70, 58
Md1 = 54
Md2 = 58
Un conjunto de datos puede tener una moda o ms de una moda o tambin no
tener ninguna moda.
3.2.2. Moda para Datos Tabulados
3.3.2.1 Moda para datos tabulados no agrupados en intervalos
(Variable Discreta)
FORMULA: Md x j
Donde: xj es el valor de la variable que corresponde a la mxima frecuencia
absoluta.

Ejemplo: Tomamos los datos de la tabla N 5


Xi
46
47
48
49
50
51
52
Total

ni
8
10
16
14
12
9
6
75

La Moda ser el valor de la variable que corresponde a la mxima frecuencia


absoluta (n4 =16), en este caso Md = 48
El resultado significa que es ms frecuente encontrar empresas con 48
trabajadores
3.3.2.2.

Moda para datos tabulados agrupados en intervalos


(Variable Continua)

FORMULA:

n j n j 1

Md y j 1 c

( n j n j 1 ) ( n j n j 1 )

Donde: nj = mxima frecuencia absoluta


nj-1 = frecuencia absoluta anterior a nj
nj+1 = frecuencia absoluta posterior a nj
yj-1 = lmite inferior del intervalo que se encuentra en la misma fila
de nj
c

= Amplitud del intervalo

Ejemplo: Vamos a tomar los datos de la tabla N 7


Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

ni
5
5
10
13
16
8
5
62

De acuerdo a la teora:
nj

= 15 yj-i = 986.5

nj-1

= 13

c = 133

nj+1 = 8
Reemplazando valores en la frmula se tiene:

15 13

15 13 15 8

Md 986.5 133
Md 1022

Los sueldos o ingresos econmicos ms frecuente de 62 trabajadores


encuentran alrededor de 1016.06 soles.
3.2.2. MODA PARA DATOS CUALITATIVOS:
La moda estar dada por la categora de la variable que corresponde a la
mxima frecuencia absoluta.
Ejemplo: Tomaremos los datos del cuadro N 1

NIVEL DE INSTRUCCIN

Primaria

2.86

Secundaria

11

15.71

Sup. No Universitaria

42

60.00

Sup. Universitaria
Total

15
70

21.43
100.00

La mxima frecuencia es 42, por lo tanto, la moda es la categora superior no


universitaria, es decir: Md = Sup. No Universitaria.
3.3. LA MEDIANA
Es el valor que divide a la totalidad de datos, ordenados en forma creciente o
decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a
la izquierda de la mediana y el otro 50% a la derecha de la mediana.
Li

Me
50%

Ls
50%

La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a
rangos.
3.3.1. MEDIANA PARA DATOS CUANTITATIVOS:
3.3.1.1. Mediana para Datos Originales
Se presentan dos caso:
a. Cuando el N de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio
de los dos valores del centro.
Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61
38 42
2
Me 40
Me

El 50% de los ingenieros tienen una edad mxima de 40 aos


b. Cuando el N de datos es Impar
Ejemplo: Los siguientes datos corresponde al n de trabajadores de 9 empresas
63, 56, 94, 32, 58, 41, 90, 45, 104
Ordenamos de forma creciente

32, 41, 45, 56, 58, 63, 90, 94, 104

Se toma el valor del centro: Me = 58


El 50% de empresas tienen un nmero mximo de 58 trabajadores
3.3.1.2. Mediana para Datos Tabulados
a. Mediana para datos tabulados no agrupados en intervalos
1 Cuando

n
N j 1
2

FORMULA:

Me = xj

Donde:
xj

Es el valor de la variable que se encuentra en la misma fila de Nj

Nj

Frecuencia absoluta acumulada inmediatamente mayor que

Nj-1

Frecuencia absoluta acumulada anterior a Nj

Ejemplo: Tomamos los datos de la tabla N 6

Xi
46
47
48
49
50
51
52
Total

Procedimiento:
1

n 75

37.5
2
2

2 Nj 48

ni
8
10
16
14
12
9
6
75

Ni
8
18
34
48
60
69
75

n
2

3 Nj 1 34

efectivamente

n
N j 1
2

4 Xj 49
Por lo tanto: Me = 49
50% de las empresas tienen como mximo 49 trabajadores.
2 Cuando

n
N j 1
2

x j 1 x j

FORMULA:

Ejemplo: Los siguientes datos corresponden al N de hijos de 54 familias


Nmero de hijos
Xi
1
2
3
4
5
6
Total

ni

Ni

5
10
12
15
8
4
54

5
15
27
42
50
54

Procedimiento:
1

n 54

27
2
2

2 N j 42
3 N j 1 27

efectivamente

n
N j 1
2

4 x j 4
5 x j 1 3
Reemplazando valores:
Me

3 4
3.5
2

El 50% de las familias tienen como mximo aproximadamente 4 hijos.


b. Mediana para datos tabulados agrupados en intervalos
1 Cuando

n
N j 1
2

n 2 N j 1

Me y j 1 c

FORMULA:

N j N j 1 )

Donde:

yj-1 = lmite inferior del intervalo que se encuentra en la misma fila


de Nj
c = Amplitud del intervalo
Nj = frecuencia absoluta acumulada inmediatamente mayor que
n
2

Nj-1= frecuencia absoluta acumulada anterior a Nj


Ejemplo: Vamos a tomar los datos de la tabla N 7
Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

procedimiento:
1

n 62

31
2
2

2 Nj= 33

ni
5
5
10
13
16
8
5
62

Nj
5
10
20
33
49
57
62

3 N j 1 20

efectivamente

n
N j 1
2

4 Y j 1 853.5
5 c = 133
Reemplazando valores se tiene:
31 20

33 20

Me 853.5 133
Me 966.04

El 50% de trabajadores tienen un ingreso mximo de 966.04 soles.


2 Cuando

n
N j 1
2

FORMULA:

Me y j 1

Ejemplo: Los siguientes datos corresponden al peso en kilos de 120 alumnos.

Peso
30 33
34 37
38 41
42 45
46 49
50 53
Total

ni
10
20
30
30
16
14
120

Ni
10
30
60
90
106
120

Procedimiento:
1

n 120

60
2
2

2 N j 90
3 N j 1 60

efectivamente

n
N j 1
2

4 y j 1 42
5 c 3
Reemplazando valores se tiene:
Me 42

El 50% de los alumnos tienen un peso mximo de 42 kilogramos.


3.3.2. MEDIANA PARA DATOS CUALITATIVOS:
Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de
ordenarse de acuerdo a rangos o categoras.

Ejemplo: Tomaremos los datos de la tabla N 01


Nivel de Instruccin
Primaria
Secundaria
Superior No Universitaria
Superior Universitaria

ni
2
11
42
15
70

Total

Ni
16
54
72
80

Procedimiento:
1

n
35
2

2 N j 54
3 N j 1 16

La mediana esta dada por la categora que se encuentra en la misma fila de Nj. Por lo
tanto, la mediana est dada por la categora Secundaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin
mximo de secundaria.

3.4. CUARTILES (Qi)


Son medidas de posicin que dividen a la distribucin de datos ordenados, en cuatro
partes iguales, de tal manera que:
Li

Q1

Q2

25%
50%
75%

Q3

Ls

3.4.1. CUARTILES PARA DATOS ORIGINALES


Una ves ordenados los datos tales que

x1 x2 x3 .... xn . El cuartil i-

simo (i = 1, 2 o 3), es el valor del dato que ocupa la posicin (

i
)( n 1 ) en el
4

ordenamiento.
Si la posicin resulta entera, se hace una interpolacin lineal entre los dos
valores correspondientes a las dos observaciones entre las cuales se encuentra
la fraccin.

Ejemplo N 1
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
econmicos semanales de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540

x1

x2

x3

x4

x5

x6 x7

- Clculo del Primer Cuartil (Q1): i =1, n =7


(

i
1
)( n 1 ) ( )( 7 1 ) 2 , posicin entera, luego Q1 = x2 = 225.
4
4

El 25% de los padres de familia, es decir 20 de ellos, tienen un ingreso


mximo de 225 soles.
- Clculo del Segundo Cuartil (Q2): i =2, n =7
(

i
2
)( n 1 ) ( )( 7 1 ) 4 , posicin entera, luego Q2 = x4 = 420.
4
4

El 50% de los padres de familia, es decir 40 de ellos, tienen un ingreso


mximo de 420 soles.
- Clculo del Tercer Cuartil (Q3): i =3, n =7
(

i
3
)( n 1 ) ( )( 7 1 ) 6 , posicin entera, luego Q3 = x6 = 460.
4
4

El 75% de los padres de familia, es decir 60 de ellos, tienen un ingreso


mximo de 460 soles.

Ejemplo N 2
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
semanales de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650

x1

x2

x3

x4

x5

x6

x7 x8

x9 x10

- Clculo del Primer Cuartil (Q1): i =1, n =10


(

i
1
)( n 1 ) ( )( 10 1 ) 2.75 , posicin no entera, luego Q1 estar entre
4
4

las observaciones x2 y x3.


Estableciendo proporciones se tiene:
Q1 x2 0.75

Q1 x2 ( x3 x2 )( 0.75 )
x3 x2
1
Q 225 ( 300 225 )( 0.75 )
Q 225 56.25
Q 281.25

El 25% de los padres de familia tienen un ingreso mximo de 281.25 soles.


- Clculo del Segundo Cuartil (Q2): i =2, n =10
(

i
2
)( n 1 ) ( )( 10 1 ) 5.5 , posicin no entera, luego Q2 estar entre
4
4

las observaciones x5 y x6.


Entonces:
Q2 x5 ( x6 x5 )( 0.5 )
450 ( 460 450 )( 0.5 )
450 5
Q2 455

El 50% de los padres de familia tienen un ingreso mximo de 455 soles.


- Clculo del Tercer Cuartil (Q3): i =3, n =10
(

i
3
)( n 1 ) ( )( 10 1 ) 8.25 , posicin no entera, luego Q3 estar entre
4
4

las observaciones x8 y x9.


Entonces:

Q3 x8 ( x9 x8 )( 0.25 )
550 ( 600 550 )( 0.25 )
550 12.5
Q2 562.5

El 75% de los padres de familia tienen un ingreso mximo de 562.5 soles.


3.4.2. CUARTILES PARA DATOS TABULADOS

Qi y j 1

FORMULA:

n(i )

4 N j 1
c

N j N j 1 )

Donde i, tomar valores de 1 a 3, segn se trate de calcular el 1, 2 tercer


cuartil.

Ejemplo
Para la tabla N 7, calcular el primer, segundo y tercer cuartil.
- Clculo del primer cuartil (Q1): i = 1
Procedimiento: Es parecido al de la mediana
1

n i 621

15.5
4
4

2 Nj = 20
3 Nj-1 = 10
4 yj-1 = 720.5
5 C

= 133

Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

ni
5
5
10
13
16
8
5
62

Ni
5
10
20
33
49
57
62

Reemplazando valores en la frmula:

Q1 y j 1

n(1)

4 N j 1
c

N j N j 1 )

15 10

20 10

Q1 720.5 133
Q1 787

El 25% de los trabajadores, es decir 16, tienen un ingreso mximo de 787 soles.
- Clculo del segundo cuartil (Q2): i = 2

Q2 y j 1

n( 2)

4 N j 1
c

N j N j 1 )

Procedimiento:
1

n i 62 2

31
4
4

2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:
31 20
Q2 853.5 133

33 20
Q2 966.04

El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966.04 soles.

- Clculo del tercer cuartil (Q3): i = 3

Q3 y j 1

n(3)

4 N j 1
c

N j N j 1 )

Procedimiento:
1

n i 62 3

46.5
4
4

2 NJ = 48
3 Nj-1 = 33
4 Yj-1 = 986.5
5 C

= 133

Reemplazando valores en la frmula:


46.5 33

48 33

Q3 986.5 133
Q3 1106 .2

El 75% de los trabajadores, es decir 47, tienen un ingreso mximo de 1106.2 soles.
3.5. MEDIDAS DESCRIPTIVAS DE RESUMEN UTILIZANDO CUARTILES
Llos cuantiles son tiles no slo como medidas de posicin no central; tambin sirven
para elaborar otras medidas importantes de tendencia central y dispersin.
Describiremos dos medidas basadas en los cuarteles: el Eje Medio y el Rango
intercuartlico.
3.5.1. EL EJE MEDIO:
Es el promedio de los cuarteles Q1 y Q3 de un conjunto de datos:
EJE MEDIO =

Q1 Q3
2

Para el ejemplo anterior: Eje Medio =

790 1092.5
2

Eje Medio = 941.25

3.5.2. RANGO INTERCUARTILICO (R.I.)


El rango intercuartlico ( llamado tambin dispersin media) es la diferencia entre los
cuartiles Q1 y Q3 de un conjunto de datos.
Para el ejemplo anterior R.I. = Q3 Q1
R.I. = 302.50
Esta medida considera la dispersin en el 50% medio de los datos y, por ello, de
ninguna manera se ve influenciada por la posible ocurrencia de valores extremos.
3.6. DIAGRAMA DE BLOQUES Y LINEAS:
Para identificar y describir las principales caractersticas de los datos, el mtodo de
Anlisis Exploratorio de Datos utiliza medidas de tendencia central y de dispersin
que tienen la propiedad de resistencia; es decir, estadsticos que son relativamente
insensibles a cambios extremos de algunos de los datos. La mediana, el eje medio y el
rango intercuartlico son tres estadsticos resistentes de uso comn. Si se combinan
estas medidas resistentes con informacin referente a los extremos, se logra entonces
una mejor idea de la forma de la distribucin de datos. Cinco son los nmeros de
resumen:
Li

Q1

Mediana ,

Q3

Ls

Para los datos originales que sirvieron para el construir la tabla N 7 se tiene:
Li = 456 ,

Q1 = 790 , Me = 950 ,

Q3 = 1092.50 ,

Ls = 1384

El diagrama de bloques y lneas ofrece una representacin grfica de los datos a travs
de los cinco nmeros de resumen. En la siguiente figura se ilustra este diagrama.

,1
1
4
0
,1
2
0
,8
0
0
,6
0
,4
0
0, In
g
re
so
3.7. DECILES (Di)
Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados,
en 10 partes.
El decil i simo es el valor del dato que ocupa la posicin

i
)( n 1 ) en el
10

ordenamiento.
Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
3.7.1. DECILES PARA DATOS ORIGINALES
EJEMPLO : Tomaremos los datos correspondiente al ingreso semanal,
previamente ordenados. de 9 trabajadores de una empresa

320, 330, 345, 410, 460, 580, 900, 940, 940

x1

x2

x3

x4

x5

x6 x7 x8

x9

Calcular el Decil 2 y el Decil 6.


Decil 2 (D2): i = 2, n = 9

2
)( 9 1 ) 2 : Posicin entera
10

Por tanto el decil 2 es el dato que ocupa la segunda posicin: D2 = 330.


El 20% de los trabajadores tienen un ingreso mximo de 330 soles.
Decil 6 (D6): i = 6, n = 9

6
)( 9 1 ) 6 : Posicin entera
10

Por tanto el decil 6 es el dato que ocupa la sexta posicin: D6 = 580.


El 20% de los trabajadores tienen un ingreso mximo de 580 soles..
3.7.2. DECILES PARA DATOS TABULADOS

FORMULA:

Di y j 1

n(i )

10 N j 1
c

N j N j 1 )

Donde i, tomar valores de 1 a 9, segn se trate del primero, segundo, hasta el


noveno decil.

Ejemplo
Para la tabla N 7, calcular el cuarto decil.

Ingreso
Econmico
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

ni
5
5
10
13
16
8
5
62

Ni
5
10
20
33
48
56
62

Procedimiento:
1

n i 62 4

24.8
10
10

2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:

D4 y j 1

n(4)

10 N j 1
c

N j N j 1 )

24.8 20
D4 853.5 133

33 20
D4 902.61

El 40% de los trabajadores, tienen un ingreso mximo de 902.61 soles.


3.8. PERCENTILES
Para el clculo de los centiles o percentiles (Pi) se procede de manera similar y las
frmulas correspondientes son:
-

Para datos originales: (

Para datos tabulados:

i
)( n 1 )
100

Pi y j 1

n(i )

100 N j 1
c

N j N j 1 )

3.9. TASAS DE CRECIMIENTO ( T.C.):


Sirve para encontrar el crecimiento de una cantidad de un periodo t con respecto a
un periodo t-1. Se calcula con la siguiente frmula:
T.C.=

Ct
x100
Ct 1

Ejemplo: Calcular las tasas de creciminto para los siguientes datos, correspondiente al
N de alumnos matriculados de una universidad, durante el periodo 2005 2010

Ao

N alumnos

2005
2006
2007
2008
2009
2010

1250
1500
1850
2120
2430
2870

Tasa (%)
xi
20.00
23.33
14.59
14.62
18.11

3.10. LA MEDIA GEOMTRICA (MG)


Se usa cuando hay que promediar tasas de crecimiento, razones o proporciones.
3.10.1. Media geomtrica Simple:

FORMULA:

log xi

MG Anti log

i 1

Ejemplo:
Calcular la media geomtrica para los siguientes datos, correspondiente al N
de alumnos matriculados de una universidad, durante el periodo 2000 2005.

Ao

N alumnos

2005
2006
2007
2008
2009
2010

1250
1500
1850
2120
2430
2870

Tasa (%)
xi
20.00
23.33
14.59
14.62
18.11

Log xi
1.301030
1.367915
1.164055
1.164947
1.257918
6.255865

Reemplazando en la frmula:
6.255865

MG Anti log
MG 17.83

El incremento promedio anual de alumnos matriculados es del 17.83%.

3.10.2. Media geomtrica Ponderada:

n log Yi
i

MG Anti log

FORMULA:

Consideremos los datos de la tabla N 7 para ilustrar el clculo.


Ingreso
Econmico
454.5 - 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

Yi
521
654
787
920
1053
1186
1319

Reemplazando valores en la frmula:


183.703823

62

MG = Antilog

ni
5
5
10
13
16
8
5
62

ni logYi
13.584189
14.077889
28.959747
38.529242
48.358854
24.592678
15.601224
183.703823

MG = 918.26
El ingreso econmico promedio de los 62 trabajadores es de 918.26 soles.
En este caso la medida ms adecuada para el anlisis de los datos es el
Promedio.
Ejercicios
Para los ejercicios del capitulo anterior, calcular el promedio, moda ,mediana,
Cuartiles,y Media Geomtrica ponderada.

CAPITULO IV

MEDIDAS DE DISPERSION

4.1. MEDIDAS DE DISPERSION


Son medidas o parmetros estadsticos que sirven de complemento a las medidas de
centralizacin en el anlisis de los datos. Es necesario tener una idea del grado de
concentracin o dispersin de las observaciones alrededor de una medida de tendencia
central.
4.2. RECORRIDO O RANGO: (R)
Viene a ser la diferencia entre el valor mayor y el valor menor de los datos, es decir:
R = Xmx Xmn
Ejem. Tomaremos los datos originales que dieron origen a la tabla N 7.
R = 1384 456 = 928 soles.
El recorrido a rango como estadgrafo de posicin es muy limitado, porque slo
considera los valores extremos de la distribucin de datos y no nos indican nada sobre el
comportamiento de los datos.
4.3. VARIANZA: ( 2 )
Es el promedio de las desviaciones con respecto al promedio elevado al cuadrado. La
varianza no tiene interpretacin .
4.3.1. Varianza para datos originales:
n

( xi x )2
i 1

Ejem. Los siguientes datos corresponde a los ingresos econmicos por semana de 12
trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la frmula, primero debemos encontrar el promedio y luego
aplicar la frmula de la varianza.
n

xi
i 1

n
600 650 200 710 300 550 420 460 450 540 850 225
12
5922
x
12
x 496.25
x

( xi x )2
i 1

( 600 496.25 )2 ( 650 496.25 )2 ( 200 496.25 )2 ...... ( 225 496.25 )2


12
419156
.
22
2
12
2
34929.685 Soles al cuadrado
2

4.3.2

DESVIACIN ESTANDAR:

Se define como la raz cuadrada de la varianza.


n

( xi x )2
i 1

Es uno de los estadgrafos de dispersin de mayor uso, en el cual las unidades de la


variable ya no estn elevadas al cuadrado.
En general los estadgrafos de dispersin se usan para comparar dos o ms
distribuciones de datos poblaciones. A mayor dispersin entre los valores o
elementos de una poblacin, le corresponde un valor mayor para el estadgrafo de
dispersin.
EJEMPLO: Encontrar la desviacin estndar para el caso anterior.

2
186.89

34929.685
Soles

La dispersin promedio que existe entre los datos y la media aritmtica es de


186.89 soles.

4.3.3

VARIANZA PARA DATOS TABULADOS

a. Varianza para Datos Tabulados No Agrupados en Intervalos:


n

FORMULA:

( xi x )2 ni
i 1

EJEMPLO: Tomaremos los datos de la tabla N 6


Xi

ni

46
47
48
49
50
51
52
Total

8
10
16
14
12
9
6
75

xini

( xi x )2

( xi x )2 ni

8.0656
3.3856
0.7056
0.0256
1.3456
4.6656
9.9856

64.5248
33.856
11.2896
0.3584
16.1472
41.9904
59.9136
228.08

368
470
768
686
600
459
312
3663

Las dos primeras columnas corresponden a la tabla N 6. Las tres


columnas siguientes son columnas de trabajo para llegar a obtener la
varianza.
La columna de trabajo N 3 sirve para encontrar el promedio.
x

x n
i

n
3663
x
75
x 48.84

Reemplazando valores de la tabla se tiene:


228.08
75 ***
3.04

2
2

Desviacin estndar:
3.0411
1.74

La variabilidad promedio del N de trabajadores por empresa es


aproximadamente de dos trabajadores
b. Varianza para Datos Tabulados Agrupados en Intervalos:
n

FORMULA:

( yi y )2 ni
i 1

EJEMPLO: Consideremos los datos de la tabla N 07 para ilustrar el


clculo.
Ingreso
Econmic
o
454.5 587.5
587.5 720.5
720.5 853.5
853.5 986.5
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
Total

yi

ni

521
654
787
920
1053
1186
1319

5
5
10
13
16
8
5
62

yini

( yi y )2 ni

2605 920343.5722
3270 438175.6132
7870 265795.3084
11960
11725.2076
16848 159035.2086
9488 445446.0435
6595 816822.9819
58636 2930667.8712

y 945.74 Soles

Reemplazando los valores en la frmula:


2930667.8712
62
47268.83662

2
2

Desviacin estndar:

47268.83662
217.41 Soles

La variacin promedio que existe entre los ingresos econmicos de los trabajadores
con respecto al ingreso promedio (945.74 soles) es de 217.41 Soles.
4.3.4. PROPIEDADES DE LA VARIANZA
a. La varianza de una constante es cero:
V(K)=0
b. La varianza del producto de una constante por una variable, es igual :
V ( K.X ) = K2 X
c. La varianza de la suma de una variable ms una constante, es igual a la varianza de
la variable: V ( X + K ) = V(X)
4.3.5. COEFICIENTE DE VARIACIN (C.V)
Es una medida de variabilidad relativa que se utiliza para comparar dos o mas
distribuciones de datos cuando las unidades de medida de las variables estn

expresadas en diferentes unidades a escalas de medida, por ejemplo los sueldos


expresados en soles y dlares.
Si comparamos dos distribuciones, ser ms homognea, la que presente menor
coeficiente de variacin.

C .V

FORMULA:

* 100
y

EJEMPLO: Calcular el coeficiente de variacin para el ejemplo anterior.


222.06
* 100
9500.0323
C .V 23.37%
C .V

Los ingresos de los trabajadores tienen una dispersin relativa de 23.37 %.


4.3.6. MEDIDAS DE ASIMETRIA
COEFICIENTES DE ASIMETRA (As)
Miden el grado de deformacin horizontal de la distribucin de frecuencias.
Indices de Asimetra de Pearson (As). Se definen:
As

3( y Me )

As

y Md

El primero es el ms usual.
Interpretacin
1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden
y Me Md

2. Si la distribucin es Asimtrica Positiva sesgada a la derecha si: As > 0.


3. Si la distribucin es Asimtrica Negativa sesgada a la izquierda si: As < 0.

EJEMPLO: Tomando los datos de la tabla N 7 correspondiente a los ingresos


econmicos de los trabajadores de 62 empresas.
3 * (950.0323 966.04)
222.06
As 0.22
As

Los ingresos tienen una distribucin asimtrica positiva


4.3.7. ESTADIGRAFOS DE APUNTAMIENTO O KURTUOSIS

La kurtuosis viene a ser el grado de apuntamiento de una distribucin.


a. Si una distribucin tiene una elevada punta o apuntamiento, se llama Leptokrtica.
b. Si la distribucin se asemeja a una distribucin normal se llama Mesocrtica
c. Si la distribucin es aplanada se denomina Platikrtica.
El estadgrafo para analizar el apuntamiento es:
Coeficiente de Kurtuosis: a =

m4
4

Donde 4 = ( 2 )2

Y
m4 =
-

Y ni
4

Si a = 3 : La distribucin es Mesokrtica ( Normal).

- Si a > 3 : La distribucin es Leptokrtica ( apuntada)


- Si a < 3 : La distribucin es Platikrtica ( aplanada )
Ejem. Para los datos de la tabla N 6
M4 = 19.45254
4 = 9.2416
Reemplazando valores: a =

19.45254
9.2416

a = 2.10
Como a = 2.10 es menor que 3, la distribucin es platikrtica (aplanada).
Ejercicios.
Para las tablas de frecuencias del capitulo II calcular: La varianza, la desviacin
estndar, el coeficiente de variacin, el apuntamiento y la asimetra.

CAPITULO V

DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

5.1 Generalidades
Cuando en un trabajo de investigacin se observa simultneamente dos
variables en cada elemento de anlisis, entonces estamos en el campo
de las estadsticas bidimensionales, cuya agrupacin, da origen a las
distribuciones de frecuencias bidimensionales.
En el caso bidimensional puede darse el caso de que se tenga:
1. Las dos variables discretas
2. Una variable discreta y la otra continua
3. Las dos variables continuas.
5.2.DISTRIBUCION

DE

FRECUENCIAS

BIDIMENSIONALES

DE

VARIABLE DISCRETA
Una tabla bidimensional de frecuencias se construye colocando en el margen
izquierdo los distintos valores de X y en el margen superior los distintos valores de
Y, generndose una tabla de p filas y q columnas.
5.2.1. Frecuencias Marginales
Las frecuencias marginales de la variable X, se obtiene sumando las frecuencias
absolutas que figuran en cada fila ( lnea horizontal)
q

ni. =

n
j 1

ij

Las frecuencias marginales de la variable Y, se obtiene sumando las frecuencias


absolutas que figuran en cada columna ( lnea vertical)
p

n.j =

n
i 1

ij

Ejem. Los siguientes datos corresponde al nmero de computadoras (X) y al


nmero de Ing. Informticos (Y) de 60 empresas tomada de la ciudad de chiclayo:
X 7 6 4 6 7 4 7 5 6 4 6 7 3 7 6 5 6 4 7 5 7 6 3 7 5 5 7 6 4 6 7 5
Y 4 4 2 3 3 1 4 3 5 3 3 3 1 2 2 2 4 2 6 3 3 3 2 6 4 3 4 4 3 2 5 3

X 6 4 6 6 5 57 6 7 5 6 7 6 7 7 7 7 6 5 7 7 3 7 7 6 4 7 6
Y 3 1 5 4 4 2 4 3 5 3 5 5 3 4 5 6 6 3 3 5 6 2 5 6 5 2 6 6

1. Elabore tablas de frecuencias absolutas bidimensionales para analizar los datos e


interprete las tablas.
2. Encuentre el promedio y la varianza para la variable X y Y
TABLA N 8

Distribucin de Frecuentas Absolutas Bidimensionales (nij) de 60 empresas por


nmero de computadoras (X) segn nmero de Ing. Informticos (Y) por empresa
Y
X

ni .
1

10

18

22

10

18

11

10

60

n.j

X : computadoras
Y : Ing. Informticos
ni. = Frecuencias marginales de la variable X
n.j = Frecuencias marginales de la variable Y
INTERPRETACIN:
n23 = 2: 2 empresas tienen 4 computadoras y 3 Ing. Informticos
n45 = 4 : 4 empresas tienen 6 computadoras y 5 Ing. Informticos
Frecuencias Marginales:
- De la variable X
n2. = 7 : 7 empresas tienen 4 computadoras

n4. = 18 : 18 empresas tienen 6 computadoras


- De la variable Y
n.3 = 18: 18 empresas tienen 3 Ing. Informticos
n.5 = 10: 10 empresas tienen 5 Ing. Informticos
TABLA N 9

Distribucin de Frecuentas Relativas Bidimensionales (hij) de 60 empresas por


nmero de computadoras (X) segn nmero de Ingenieros Informticos (Y) por
empresa

hi.

0.02

0.03

0.05

0.03

0.05

0.03

0.11

0.03

0.10

0.03

0.16

0.03

0.12

0.07

0.07

0.02

0.31

0.05

0.08

0.10

0.12

0.37

0.30

0.18

0.17

0.14

1.00

7
h.j

0.02
0.05

0.16

Interpretacin:
h23 = 0.03 : El 0.08 por uno de empresas tienen 4 computadoras y 3 Ing. Informticos
h45 = 0.07: El 0.07 por uno de empresas tienen 6 computadoras y 5 Ing. informticos
Frecuencias Relativas Marginales:
- De la variable X:
h2. = 0.11: El 0.11 por uno de empresas tienen 4 computadoras
h4. = 0.31: El 0.31 por uno de empresas tienen 6 computadoras
- De la variable Y:
h.3 = 0.30 :El 0.30 por uno de empresas tienen 3 Ing. Informticos

h.5 = 0.17: En el 0.17 por uno de empresas tienen 5 Ing. Informticos


TABLA N 10

Distribucin de Frecuentas Absolutas Bidimensionales Acumuladas (Nij) de 60


empresas por nmero de computadoras (X) segn nmero de ingenieros (Y) por
empresa

Y
X

10

10

10

10

10

18

20

20

20

12

27

31

35

36

13

31

42

52

60

Interpretacin:
N23 = 10: 10 empresas tienen de 3 a 4 computadoras y de 1 a 3 Ing. Informticos
N35 = 20: 20 empresas tienen de 3 a 5 computadoras y de 1 a 5 Ing. Informticos

TABLA N 11

Distribucin de Frecuentas Relativas Bidimensionales Acumuladas (Hij) de 60


empresas por nmero de computadoras (X) segn nmero de Ingenieros
Informticos (Y) por empresa

Y
X

0.02

0.08

0.08

0.08

0.08

0.08

0.05

0.13

0.16

0.16

0.16

0.16

0.05

0.16

0.29

0.32

0.32

0.32

0.05

0.19

0.44

0.54

0.61

0.63

0.05

0.21

0.51

0.69

0.86

1.00

Interpretacin :
H25 = 0.16: El 0.16 por uno de empresas tienen de 3 a 4 computadoras y de 1 a 5
ingenieros informticos
H34 = 0.32: El 0.32 por uno de empresas tienen de 3 a 5 computadoras y de 1 a 4 ing.
Informticos

TABLA N 12
Distribucin de Frecuentas Relativas Bidimensionales Porcentuales (hijx100) de 60
empresas (X) segn nmero de Ing. Informticos (Y) por empresa
Y
X

hi.
1

11

10

16

12

31

10

12

37

16

30

18

17

14

100

h.j

Interpretacin:
h34 = 3: El 3% de empresas tienen 5 computadoras y cuatro ingenieros informticos
h45= 7: El 7% de empresas 6 computadoras y 5 ingenieros informticos

TABLA N 13

Distribucin de Frecuentas Relativas Bidimensionales Porcentuales Acumuladas


(Hijx100) de 60 empresas segn Numero de computadoras (X)y nmero de Ing.
Informticos ( Y) empresa
Y
X

13

16

16

16

29

32

19

44

54

0.61

0.63

21

69

0.86

1.00

51

Interpretacin:
H22x100 = 13: El 13% de empresas tienen de 3 a 4 computadoras y de uno a dos ing.
Informtico.
H43x100 = 44: El44 % de empresas tienen de 3 a 6 computadoras y de uno a tres Ing.
Informticos

2. Calculo del promedio


a. PARA X1 :

1i

ni .

n..

3 x 3 4 x 7 5 x10 6 x18 7 x 22
5.82
60

x 5.82

El nmero promedio de computadoras por empresa es de aproximadamente 6

PARA Y:

n. j

n..

1x 3 2 x10 3 x18 4 x11 5 x10 6 x8


3.65
60

y 3.65

El nmero promedio de ing. Informticos por empresa es de aproximadamente 4

CALCULO DE LA VARIANZA
a.

PARA X :

12

( x

x ) 2 ni .
n..

Reemplazando valores:
12

(3 5.82) 2 x 3 ( 4 5.82) 2 x 7 (5 5.82) 2 x10 (6 5.82) 2 x18 (7 5.82) 2 x 22

60

23.86 23.19 6.72 0.58 30.63 84.98

60
60
1.42

12
12

1 1.19

b.

PARA Y:

22

( y

y 2 ) 2 n. j
n..

Reemplazando valores:

22

(1 3.65) 2 x 3 ( 2 3.65) 2 x10 (3 3.65) 2 x18 ( 4 3.65) 2 x11 (5 3.65) 2 x10 (6 3.65)
60
1.99

22
2 1.41

5.3. DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE VARIABLE


CONTINUA Y VARIABLE DISCRETA
Las variables bidimensionales (X,Y) conservan la misma nomenclatura y las tablas
tienen la misma forma.

Ejem. Los siguientes datos corresponde al ingreso mensual (X) y al N de hijos (Y)
De 60 trabajadores de una empresa:

X 1095 1060 1450 1520 1320 1580 1600 1080 1150 1200 1190 1475
Y

X 1515 1100 1420 1580 1280 1200 1550 1170 1800 1020 1525 1435
Y

X 932 1180 1365 932 1415 1553 1225 1650 1181 932 1429 1300 1030
Y

X 1620 1485 1305 1425 1390 1450 1380 1700 1515 1200 1320 1650 1650
Y

X 1380 1540 1120 1305 1750 1300 1250 1415 1670 1380
Y

1. Construir tablas de frecuencias bidimensionales, utilice intervalos cerrados,


interprete los datos
2. Calcular el promedio y la varianza para la variable X y Y
Solucin:
Variable Ingresos X:
Ls = 1800 Li = 932
R = 868
m = 2.5 4 60
m=7
C = R/m
C = 868/7
C = 124
Variable N de hijos: Li = 1,

Ls = 6

Tabla N 14
Distribucin de frecuencias absolutas bidimensionales (nij) de ingresos
econmicos (X) y Nmero de hijos (Y) de 60 trabajadores de una empresa

[Xi-1 Xi]
932 - 1056
1057 - 1180
1181 - 1304
1305 - 1428
1429 - 1552
1553 - 1676
1677 - 1800
n.j

Yi
Xi
994
1118.5
1242.
1366.5
1490.5
1614.5
1738.5

ni.

2
1
3

1
5
4
2
12

1
2
5
4
3
2

1
4
4
4
1

2
1
2
3
-

2
-

17

14

5
8
10
13
12
9
3
60

3
1
-

n52 = 5 : 5 trabajadores tienen un ingreso de 1429 a 1552 soles y tienen 2 hijos por
trabajador.
n4. = 13: 13 trabajadores tienen un ingreso de 1305 a 1428 soles
n.5 = 8 : 8 trabajadores tienen 5 hijos cada uno
n3. = 10 Vrs. Y3 = 1242: 10 trabajadores tienen un ingreso promedio de 1242 soles.
El resto de tablas de frecuencias bidimensionales se construyen de manera similar a las
tablas anteriores.
2. Variable X:
a. Promedio:
n

X=

X n
i

i 1

i.

n..

994 x 5 1118 .5 x8 1242 x10 1366.5 x13 1490.5 x12 1614.5 x 9 1738.5 x 3
60

X 1362.24

El ingreso promedio mensual de los 60 trabajadores de la empresa es 1362.24 soles


b. Varianza:
n

2
2

X
i 1

X ni .
2

994 1362.24 2 x5 1118 .5 1362.24 2 x8 ........ 1738.5 1362.24 2 x 3


60

2 41548.80

= 203.84
La variacin promedio que existe entre los ingresos de los trabajadores con respecto al
ingreso promedio es de 203.84 soles.
5.4. EJERCICIOS:
1. Los siguientes datos corresponde la edad y al nmero de hijos de 50 padres:
Edad: 34 33 44 40 33 50 32 44 36 43 38 39 42 39 31 28 28 21 44
Hijos 3 2 5 4 3 6 3 4 3 5 3 2
4 5 3
2 2 1 5

Edad: 46 32 46 34 30 34 42 39 48 36 32 39 30 45 26 40 38 47 36 60
Hijos 6 2 6 3 2 3 4 3 5 3 2 3 2 3 2 3 2 5 4 6
Edad: 40 45 33 32 45 28 25 35 48 40 30
Hijos: 3 2
2 3 4 2 2 3
4 3 2
Construya tablas bidimensionales para analizar los datos.
2. Encuentre el promedio y la varianza para cada una de las variables del problema
anterior.
3. Los siguientes datos corresponde a los ingresos econmicos mensuales de 52
trabajadores de una empresa y a los aos de servicio:
Ingresos: 750 693 789 890 1240 945 1320 1200 1350 780 865 946 1050 830
Aos de 4 3
4
4
6
5
8
6
7
4
5
6
6
5
Servicio
Ingresos : 1560 1450 1000 1230 1500 1680 984 960 1380 1400 1600 1284
Aos de : 10
12
10 14
12
16 10 9
13
20
18
14
Ingresos : 1320 1245 965 845 760 896 1300 840 730 645 798 1620 1740 840
Aos de : 15
17 12 14 11 10 18 9
8
4 6
22 24
8
Servicio
Ingresos : 1350 1000 1120 1040 1080 1600 1750 1800 960 830 977 1120
Aos de 16
10
14
12
11 22
20
28
20 12 14
15
Servicio
Construir tablas de frecuencias bidimensionales para analizar los datos.
4. Para la tabla de frecuencias absolutas bidimensionales del problema anterior, calcular
el promedio , la varianza y la desviacin estndar.

CAPITULO VI :
PROBABILIDADES

6.1.

Experimento aleatorio: Es aquel cuyos resultados dependen del azar.

6.2.

Punto muestral: Viene a ser cada uno de los resultados de un


experimento.
Ejem. Cuando se lanza una moneda, existen dos puntos maestrales: cara, sello.

6.3.

Espacio muestral (S): Viene a ser todos los resultados posibles de un


experimento.
Ejem. Si se arroja una moneda: S = C, S
Ejem. Si arrojamos dos monedas: S = CC, CS, SC, SS
Ejem. Si arrojamos un dado: S = 1, 2, 3, 4, 5, 6

6.4.

Suceso o evento: Viene a ser un subconjunto del espacio muestral y


-puede ser
Simple o compuesto.
6.4.1.

Evento Simple: Es aquel que consta de un solo punto muestral.

6.4.2.

Evento compuesto: Es aquel que consta de dos o ms puntos maestrales.


Ejem. Si arrojamos un dado: S = 1, 2, 3, 4, 5, 6
Sucesos o eventos simples: E1 = {1}

E2 = {2}

E3 = {5}

Sucesos o eventos compuestos: E1 = {1, 3}; E2 = {1, 4, 5}


A los sucesos o eventos se les puede simbolizar con cualquier letra.
6.5.

Sucesos mutuamente excluyentes: Dos sucesos A y B son mutuamente


excluyentes si: AWB = . Ejem. A = {1, 3, 5}; B = {2, 4, 6}, entonces c se
puede ver, la interseccin es igual al conjunto nulo o vaco

6.6.

Sucesos complementarios: Dos sucesos son complementarios, cuando


la ocurrencia de uno implica la no ocurrencia del otro.
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6}.
y tenemos los eventos E = { 1 , 2, 3, 4 }

E = { 5, 6 }, entonces estos

eventos son complementarios.


6.7.

Definicin de probabilidad: Si un experimento puede ocurrir en n


posibles resultados mutuamente excluyentes y si m de estos resultados
constituyen el evento E, entonces, la probabilidad del evento E esta dado por: P
(E) = m/n.
La probabilidad del complemento del evento esta dado por:
P (E) = 1 P (E)
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6} y sea los eventos:
E1 = {1, 2}, entonces P (E1) = 2/ 6 = 0.5

E2 = {3, 4, 5, 6}, entonces P (E2) = 4/6 = 0.67.


Ejem. Se tiene 6 Ing Informticos , 8 ing. Civiles y 2 ing. Industriales
a. Cul es la probabilidad de elegir un ing. Informtico?
b. Cul es la probabilidad de elegir un Ing. Civil?
c. Cul es la probabilidad de elegir un Ing. Informtico
Solucin:
a. P (H) = 6/16 = 0.38
b. P ( A ) = 8/ 16 = 050
c. P ( V ) = 2/16 = 0.13
6.8.

Definicin: Sea S un espacio muestral y sea E un evento cualquiera,


perteneciente al espacio muestral S, entonces se cumple que:

a.

0 P( E ) 1

b.

P( S ) = 1
La parte a, significa que toda probabilidad de un evento siempre vara entre cero
y uno.
La parte b, significa que siempre la probabilidad de un espacio muestral es igual
a la unidad

6.9. Reglas de Probabilidad:


a. Regla de la Adicin o de la Suma: Sean A y B dos eventos pertenecientes al
espacio muestral S , entonces se cumple que :
P(AUB) = P(A) + P(B) P(AWB)
Ejem. Se tiene 5 ing. Informticos, 7 ing. Civiles y 2 ing. que tienen ambos
ttulos. Se elige un ing. Cul es la probabilidad de que el ing. elegido sea
Informtico o civil?
Solucin: Con una letra simbolizaremos a los eventos:
Ing. Infrmaticos: I , Ing. Civiles: C , entonces aplicamos la regla:
P(I U C) = P(I) + P(C) P(IWC)
P(G U F) = 5/14 + 7/14 2/14 = 10/14 = 0.71
Ejem. En la Facultad de Ingeniera de una universidad se tiene 20 Ingenieros:
14 son Ing. Informticos de los cuales 11 tienen grado de maestra y 3 tienen
doctorado . 6 son Ing. Industriales, de los cuales 4 tienen grado de maestra y

2 tienen doctorado. Se elige un Ing. al azar Cual es la probabilidad de que el


ing. elegido sea Ing. Informtico o que tenga grado de maestra?
Solucin: Los datos vamos a colocar en una tabla de dos entradas puesto que
en el problema tenemos dos variables (especialidad y grado acadmico ).
Luego con una letra vamos a simbolizar a los eventos.

Grado Acadmico
Especialidad

Maestra

Doctorado

(C)

(D)

11

14

15

20

TOTAL

Ing. Infrmtico
(A)
Ing. Industrial
(B)
TOTAL
P(A U C) = P(A) + P(C) P(AWC)
P( AUB ) = 14/20 + 15/20 11/20 = 18/20 = 0.90
b. Regla de la Adicin para sucesos independientes: Sean A y B dos eventos
independientes pertenecientes al espacio muestral S, entonces se cumple que:
P(AUB) = P(A) + P(B).
Ejem. En el aula A de una universidad se tiene 18 alumnos varones y 8 alumnas
mujeres. Se elige un alumno cual es la probabilidad de que el alumno elegido sea
hombre o mujer?.
Solucin:
Sea H alumnos hombres y M alumnas mujeres, entonces: P(HUM) = P(H) + P (M) ,
reemplazando valores:
P(HUM) = 18/26 + 8/26 = 1.

c. Regla de la Probabilidad Condicional


Sean A y B dos eventos pertenecientes al espacio muestral S , con P(B) > 0 ,
entonces se cumple que: P(A/B) = P(AWB)/ P(B).
Ejem. Tomaremos los datos de la tabla anterior. Cul es la probabilidad de que el
profesional elegido sea Ing. Industrial dado que tenga grado de doctor?
P(B/D) = P(BWD)/P(D) =

2 / 20
= 2/5 = 0.40
5 / 20

d. Regla de la multiplicacin:
Sean A y B dos eventos pertenecientes al espacio muestral S , entonces se cumple
que : P(AWB) = P(A) P(B/A).
Ejem. En un curso de programacin, 22 alumnos aprobaron el curso y 10
desaprobaron. Se extraen dos alumnos, uno tras otro y sin reposicin Cul es la
probabilidad de que el primer alumno elegido y el segundo hayan aprobado el curso:
Sea A , alumnos aprobados y sea D, alumnos desaprobados, entonces
P(A1WA2) = P(A1) P(A2/A1), remplazando valores se tiene:
P(VWH) = 22/32* 21/31 = 462/992 = 0.47
e. Regla de la multiplicacin para sucesos independientes
Sean A y B dos sucesos independientes pertenecientes al espacio muestral S,
entonces se cumple que : P(AWB) = P(A) P(B)
Ejem Se tiene dos grupos de alumnos, A y B que llevan el curso de matemticas. En el
grupo A se tiene 32 alumnos aprobados y 10 desaprobados. En el grupo B se tiene 36
alumnos aprobados y 8 desaprobados . Se extrae un alumno del grupo A y luego un
alumno del grupo B . Cual es la probabilidad de que el primer alumno elegido haya
sido un aprobado y el segundo un desaprobado.
Solucin:
Sea a , alumnos aprobados y sea d, desaprobados, entonces

P(aWd) = 32/40* 8/44 =

256/1760 = 0.15.
f. Regla de Bayes
Sean A1, A2, A3, ., An , n eventos pertenecientes al espacio muestral Sy sea B
un evento cualquiera, con P(B) > 0, entonces se cumple que :

Ai
Ai

n
B
B
P Ai P

Ai
i 1

P Ai P

Ejem. En una empresa A se tiene 10 obreros , 18 empleados y 5 ejecutivos. En la sala


B , se tiene 13 obreros ,25 empleados y 4 ejecutivos. En la empresa C, se tiene 8
obreros, 14 empleados y 3 ejecutivos Se elige una empresa y se extrae un trabajador, el
mismo que resulto que era empleado. Cual es la probabilidad de que el trabajador
elegido proceda de la empresa:
a. A
b. B
c. C
Solucin
Simbolizaremos con O, a los obreros; con E, a los empleados y con Ej. a los
ejecutivos. Ahora aplicamos la frmula:
P A P E / A
a) P A E
P ( A) P ( E / A) P ( B ) P ( E / B ) P (C ) P ( E / C )

E 1 18

P A

3 33

1

3
1

3

18

33
25 1


42 3

18
99

0.32
18
25 14
14

99 126 75
25

P B P E / B
b) P B E
P ( A) P ( E / A) P ( B ) P ( E / B ) P (C ) P ( E / C )

PB

c) P C E

1

3
1 18 1


3 33 3

25
25

42
84

0.35
18 25 14
25 1 14

99 126 75
42 3 25

PC P E / C
P ( A) P ( E / A) P ( B ) P ( E / B ) P (C ) P ( E / C )

E 1 18

PC

3 33

1

3
1

3

14

25
25 1


42 3

14
108

0.33
18 25 14
14

99 126 75
25

6.10.

EJERCICIOS

1. Construir el espacio muestral para los siguientes experimentos:


a. Cuatro electores elegidos al azar deben expresar su opinin favorable o
contraria
a un determinado proyecto.
b. Un experimento consiste en seleccionar tres libros de un proceso de
elaboracin y observar si son defectuosos o no.
c. Se lanzan dos dados
d. Se lanzan cuatro monedas.
2. Con respecto a los electores del problema N 1 (a),cual es la probabilidad de
obtener:
a. Exactamente 3 electores con opiniones favorables sobre el proyecto.
b. A lo mas dos electores con opiniones favorables sobre el proyecto.
2. Se realizo una evaluacin de su estado nutricional de 56 alumnos de un centro
educativo , obtenindose los siguientes resultados: El estado nutricional de 20
alumnos fue normal, de los cuales 6 tuvieron una edad de 6 a 7 aos y 8 de 8 a 9
aos. 17 presentaron desnutricin leve, de los cuales 4 presentaron edades de 10
a 11 aos y 7 de 8 a 9 aos. 12 presentaron desnutricin moderada, de los cuales
5 presentaron edades de 6 a 7 aos y 3 de 10 a 11 aos. 7 presentaron
desnutricin severa, de los cuales 3 presento edades de 6 a 7 aos y 2 de 8 a 9
aos. Se elige un alumno, cual es la probabilidad de que:
a. Presente desnutricin leve o que tenga una edad de 6 a 7 aos.
b. Presente desnutricin severa y que tenga una edad de 8 a 9 aos.
c. Presente desnutricin moderada dado que tenga una edad de 10 a 11
aos.
3. Se lanzan dos dados, cual es la probabilidad de que:
a. La suma que aparece sobre los dados sea un nmero par.
b. El primer resultado sea un nmero menor que 3 y el segundo un nmero
impar.
4. El centro educativo 1021, cuenta con 10 profesores de fsica y 08 de qumica. El
centro educativo 1130, cuenta con 14 profesores de fsica y 6 de qumica. Se
traslada un docente del C.E. N 1021 al centro educativo N 1130 y luego se
extraen 2 docentes de este centro educativo, uno tras otro y sin reposicin. Cul
es la probabilidad de que:
a. El primer docente extrado sea de fsica y el segundo tambin.
b. El primer docente extrado sea de la especialidad de fsica y el segundo
de ciencias qumicas.
5. En un aula A hay 16 alumnos de la especialidad de primaria, 12 de secundaria y
7 de inicial. En el aula B, 14 son de la especialidad de primaria, 8 de secundaria
y 5 de inicial. En el aula C, 20 son de la especialidad de primaria, 12 de
secundaria y 8
de inicial. Se elige un aula y se extrae un alumno, el mismo que fue de la
especialidad de secundaria. Cul es la probabilidad de que provenga:
a. Del aula A.
b. Del aula B.
c. Del aula C.

6. En el aula A estudian, 25 alumnos hombres y 16 mujeres. En el aula B estudian


35
Hombres y 26 mujeres. Se elige al azar una aula y se extrae un alumno. Cul es
la probabilidad de que el alumno elegido sea hombre.
7. La probabilidad de que a lo mas 20 alumnos aprueben el curso de estadstica
Aplicada es 0.35. Cual es la probabilidad de que aprueben el curso ms de 20
alumnos.
8. Se lanza un dado normal. Se gana 30 dlares si el resultado es un nmero par o
Divisible por 3. Cul es la probabilidad de ganar?...
9. Se lanza un dado normal. Dado que el resultado es un nmero impar. Cul es la
probabilidad de que sea mayor que 3?.
10. Una urna A contiene 18 libros buenos y 2 con fallas. Una urna B, contiene 24
libros buenos y 4 con fallas. Se elige una urna y se extrae un libro. Si el
libro elegido es bueno se recibe un premio de 30 dlares. Cul es la probabilidad
de ganar el premio?.
11. Se tiene 4 aulas, en el aula N 1, se tiene 22 alumnos aprobados y 8
desaprobados en
un curso de matemticas. En el aula N 2, se tiene 18 alumnos aprobados y 6
desaprobados. En el aula N 3 , se tiene 15 alumnos aprobados y 10
desaprobados. En el aula N 4, se tiene 26 aprobados y 15 desaprobados. Se
elige una aula y se extrae un alumno, el mismo que result ser un aprobado.
Cul es la probabilidad de que el alumno provenga:
a. Del aula N 1.
b. Del aula N 2.
c. Del aula N 3.

CAPITULO VII

DISTRIBUCIONES DE PROBABILIDAD

7.1. DISTRIBUCIN BINOMIAL


Es una distribucin de variable discreta que trata de una serie de pruebas
repetidas e independientes y donde a cada resultado se le puede clasificar
(arbitrariamente) en dos categoras mutuamente excluyentes: xitos y fracasos,
como por ejemplo macho o hembra, alivio o enfermedad.

A la probabilidad de xito se representa como p y a la probabilidad de fracaso


como q, de tal manera que p + q = 1

La funcin de probabilidad es la siguiente:


n!
p x q n x
x! ( n x)!

f ( x)

Promedio: = np
Varianza : 2 = npq

Ejemplo 1. Una familia tiene 8 hijos Cul es la probabilidad de que la familia


tenga:
a. Exactamente 5 hijos varones
b. Por lo menos 6 hijos varones
c. A lo mas 2 hijos varones

SOLUCIN
N=8
S = H , M (Espacio muestral de acuerdo al sexo)
Entonces:
1
2

P(H)= p 1 / 2 0.5
P(M)=

1
p 1 / 2 0.5
2

a) X = 5

Reemplazando valores:
f (x )

8!
(0.5) 5 (0.5) 85
5! (8 5)!

f (x)

8* 7 * 6 * 5
(0.5) 5 (0.5) 85
5!3!

f ( x ) 56(0.03125
)(0.125)

f ( x ) 0.22

b) X = 6, 7, 8

f (x)

8!
8!
8!
(0.5) 5 (0.5) 85
(0.5) 7 (0.5) 87
(0.5) 8 (0.5) 88
6! (8 6)!
7! (8 7)!
8! (8 8)!

f ( x) 0.22 0.03 0.0039


f ( x) 0.2539

c) X = 0, 1, 2
f (x )

8!
8!
8!
(0.5) 0 (0.5) 80
(0.5)1 (0.5) 81
(0.5) 2 (0.5) 82
0! (8 0)!
1! (8 1)!
2! (8 2)!

f ( x ) 0.0039 0.0313 0.1092


f ( x) 0.1444

Ejemplo 2. El 20% de los alumnos que llevan un curso de matemticas estn


desaprobados. Se elige una muestra de 12 alumnos. Cual es la probabilidad de
que:
a) Exactamente 3 alumnos estn desaprobados
b) Por lo menos 10 alumnos estn desaprobados
c) A lo ms 1 alumno haya sido desaprobado

SOLUCIN

alumnos desaprobados
q = 80% = 0.80 alumnos aprobados
p = 20% = 0.20

n = 12

a) x = 3
f (x)

12!
(0.20) 3 (0.80)123
3! (12 3)!

f ( x) 0.24

b) x = 10, 11, 12
f (x)

12!
12!
12!
(0.20)10 (0.80)1210
(0.20)11(0.80)1211
(0.2
10! (12 10)!
11! (12 11)!
12! (12 12)!

f ( x) 0.068719 0.206158
f ( x ) 0.2749

7.2.

DISTRIBUCIN DE POISSON

Es una distribucin discreta, donde la ocurrencia de los eventos son


independientes. Esta distribucin se emplea cuando recuentan los eventos o
cantidades, distribuidas al azar en espacio o tiempo.

Si X es el nmero de ocurrencias de algn evento aleatorio en un intervalo de


espacio o tiempo (o algn volumen de materia), la probabilidad de que X ocurra
esta dada por:

f ( x)

e x
,
x!

x =

0, 1, 2, 3

Donde:
= es el N promedio de ocurrencias del evento aleatorio dentro del intervalo

de espacio o tiempo (volumen)


e = 2.7183 es una constante
Media =

Varianza =

EJEM. Parte de una va pavimentada por una compaa A recientemente, tuvo


en promedio, dos fallas por Km. Despus de haber sido utilizada durante 6
meses . Si esta compaa sigue pavimentando el resto de la va,
a. Cual es la probabilidad de que se presenten 3 fallas en cualquier Km. de la
va despus de haber tenido un trfico durante 6 meses?.
b. Cual es la probabilidad de que se presenten 3 o ms fallas en cualquier km de
la via?

SOLUCIN
a)

2 ,

f ( x)

x=3

e x
x!

f (x) =

2.7183 2 2 3
3!

f(x) = 0.18

b) f ( x)

e x
x!

En este caso vamos ha resolver por el complemento


f(x) = 1 - P(xi )

f(x) = 1 [

donde xi = 0,1,2

2.7183 2 2 0 2.7183 2 2 1 2.7183 2 2 2


0!

1!

2!

f(x) = 0.05

Para resolver este problema tambin se puede hacer uso de la tabla de la distribucin de
POISSON acumulada
EJEM 2.
Un lquido contiene ciertas bacterias cuyo promedio es de 4 por cm3. Hallar la probabilidad de
que no exista bacteria alguna:
a) En 0.5 cm3
b) En 1 cm3

SOLUCIN
4 por cm3 de liquido

a) En 0.5 cm3 2 por 0.5 cm3 de lquido


X=0
(2.7183) 2 (6)0

0!

f (X = 0) =

f (X = 0) = 0.1353
b) En 1 cm3 4 ,

x=0

(2.7183) 4 ( 4)0

0!

f (X = 0) =

f (X = 0) = 0.0183

7.3.

DISTRIBUCIN NORMAL

Es una distribucin de variable continua muy utilizada en trabajo de


investigacin, fue descubierta por GAUSS. Se conoce tambin con el nombre de
Curva de GAUSS y presenta las siguientes caractersticas:
1. La mayor frecuencia se ubica en el centro
2. El promedio (u), la moda (Md) y la mediana (Me) coinciden
3. Es una curva simtrica, donde e rea o probabilidad bajo la curva es igual a 1
o al 100%
4. Los extremos de la curva se acercan al eje horizontal pero no cortan a este
eje.

0.5

0.5

u
Md
Me

La funcin de probabilidad de a curva esta dada por:


f ( x)

donde

1
e
2

( x u )2
2 2

En la ecuacin, los dos parmetros de la distribucin son, la media (u) y la desviacin


estndar ( ).

y e son constantes con valores de 3.1416 y 2.7183 respectivamente.

determinan completamente la distribucin normal. Es decir para


cada valor diferente de u y se tiene una distribucin normal diferente. Valores
Los parmetros u y

diferentes de u trasladan el grfico de la distribucin al lo largo del eje X. Los valores


de

determinan el grado de aplanamiento o levantamiento (apuntamiento de la

grfica). Ejm.

u1

u2

u3

u1 u2 u3

1 2 3

Usando la tabla correspondiente de la distribucin normal se puede comprobar que:


El rea comprendida entre u

u es aproximadamente 68.26% del rea total.

El rea comprendida entre u 2

u 2 es aproximadamente 95.4% del rea

u 3 es aproximadamente 99.7% del rea

total.
El rea comprendida entre u 3
total.
La esperanza y la varianza de una variable aleatoria con distribucin normal es:
E ( x) u

V ( x) 2

7.4. DISTRIBUCIN NORMAL ESTNDAR O TIPIFICADA


Esta distribucin se obtiene creando una variable aleatoria z

xu
y haciendo u=0 y

1 , entonces:
f ( z)

1
e
2

z2
2

z
Para calcular el rea entre dos puntos Zo y Z1 es necesario calcular la siguiente integral:
Z1

Z0

1
e
2

z2
2 dz

Pero como existen tablas que proporcionan los resultados de las integraciones, no es
necesario realizar la integracin.

La tabla que utilizaremos nos da las reas bajo la curva normal a partir del centro de la
curva hacia la derecha y como la curva es simtrica para valores negativos de Z se
leern con valores positivos en la tabla correspondiente de la distribucin normal. (La
tabla se encuentra en el apndice

Ejem.
1.

a) Calcular: P(0 Z 2)
Graficamos la curva y marcamos los puntos Z=0 y Z=2 y luego sombreamos
el rea comprendida entre los dos puntos.
La tabla de la distribucin normal de una probabilidad de 0.4772.

Z 3

Z 2

Z 1

Z 0

Z 1

0.4772

Z 2

Z 3

b) Calcular: P (1.25 Z 2.58)

Z 3

Z 2

Z 1

Z 0

Z 1

Z 2

0.39342

Z 3

0.4951
0.4951 0.3944 = 0.1007

c) Calcular P ( Z 1.45)

Z 3

Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.4265

0.5

0.5 0.4265 = 0.0736


d) Calcular: P (2.15 Z 0.95)

Z 3

Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.3289

0.4842
0.4842 0.3289 = 1.1553

d) Calcular: P ( Z 2.25)

Z 3

Z 2 Z 1 Z 0 Z 1 Z 2 Z 3
0.4878
0.5

0.5 0.4878 = 0.0122

Ejem. El coeficiente de inteligencia de un grupo de alumnos tiene aproximadamente


una distribucin normal con un puntaje promedio de 100 y una desviacin estndar
de 10.5. Encontrar:
a) La proporcin de alumnos con coeficientes de inteligencia mayores que
120

b) La proporcin de alumnos con coeficientes de inteligencia menores que


115
c) La proporcin de alumnos con coeficientes de inteligencia entre 114 y
124
d) Si el N total de alumnos es 180, Cual es el nmero de alumnos que
tienen coeficiente de inteligencia entre 114 y 124?
SOLUCIN
Datos:
= 100
= 10.5

a)

X = 120

Sabemos que Z

Remplazando valores se tiene:


120 100
10.5
Z 1.90
Z

Z 3

Z 2Z 1 Z 0 Z 1

Z 2

0.4713

0.5
0.5 0.4713 = 0.0287
b) X = 115

Z 3

Z=

115 100
10.5

Z = 1.43

Z 3 Z 2

0.5

c) X1 = 114 y
z1 =

Z 1 Z 0

Z 3

0.5 + 0.42360.=4236
0.9236

X2 = 124

114 100
10.5

z1 = 1.33

Z 1Z 2

z2 =

124 100
10.5

z2 = 2.29

Z 3 Z 2 Z 1

Z 0

Z 1

0.4082
0.4890

Z 2

Z 3

0.4890 - 0.4082 = 0.0808


d) Ya sabemos que la probabilidad ante 114 y 124 aos es 0.0808, entonces el N de
alumnos ser: 180x 0.0808 = 14.54

7.5. DISTRIBUCION CHI- CUADRADO


Es una prueba no parametrica que se utiliza para determinar la asociacin entre
variables. La frmula es la siguiente:
2 =

fe

fe

Ejem. A un grupo de 132 alumnos se les ense la matemtica por tres mtodos I, II y
III. Por el mtodo I se enseo a 35 alumnos de los cuales 25 aprobaron. Por el mtodo II
se enseo a 47 alumnos, de los cuales 12 desaprobaron. Por el mtodo III se enseo a 50
alumnos , de los cuales 42 desaprobaron . Pruebe la hiptesis para verificar si los
mtodos de enseanza estn asociados al rendimiento de los alumnos. Utilice = 5%.
Solucin
Vamos ha elaborar la tabla de datos:
Mtodos de enseanza Aprobados
fo
25
35
42
102

I
II
III
TOTAL

fe
27.05
36.32
38.64

Desaprobados

Total

fo
10
12
8
30

35
47
50
132

fe
7.95
10.68
11.36

Hiptesis :
Ho: Los mtodos de enseanza no estn asociados al rendimiento de los alumnos
H1: Los mtodos de enseanza si estn asociados al rendimiento de los alumnos
Reemplazando en la formula:
2 =

25 27.05 2
27.05

35 36.32 2
36.32

...........

8 11.36 2
11.36

2 = 2.18 Valor calculado


Ahora encontramos el valor en la tabla de la chi cuadrado para poder comparar con el
valor calculado. Si el valor calculado es mayor que el valor de la tabla, rechazamos la
hiptesis nula ( Ho), Caso contrario aceptamos Ho .

Valor de la tabla: 20.95,(c-1)(f-1) = 20.95,1x2 = 20.95,2 = 5.99


Conclusin: Aceptamos Ho

7.6. EJERCICIOS
1. Se lanza 5 veces una moneda . Cual es la probabilidad de obtener:
a. Exactamente 3 caras
b. Por lo menos 3 caras
c. A lo mas dos caras
2. Se lanza un dado 7 veces. Cual es la probabilidad de obtener exactamente 4 veces el
N 6.
3. Un estudio de las corrientes de carga en sistemas de alimentacin de computadoras en
instalaciones revel que el 10% de las instalaciones tenan razones de corriente neutral a
corriente de carga total altas. Se escoge una muestra aleatoria de 5 sistemas de
alimentacin de computadoras de un gran nmero de instalaciones , Que probabilidad
hay de que:
a. Exactamente tres tengan una relacin de corriente neutral a corriente de carga total
alta.
b. Por lo menos 3 tengan una relacin alta
c. Menos de 3 tengan una relacin alta.
4. Calcule la media, la varianza y la desviacin estndar de una variable aleatoria
binomial con n=20 y p = 0.6. Construya el intervalo 2.
5. El N de grietas por plancha de concreto hechas con cierto tipo de mezcla de
cemento tiene una distribucin de probabilidad de poisson aproximada. Adems , se
sabe que el N medio de grietas por plancha de concreto es 2.5.
a. Calcula la media y la desviacin estndar .
b. Cual es la probabilidad de que una plancha de concreto escogido al azar tenga
exactamente 5 grietas.
c. Calcule la probabilidad de que una plancha de concreto escogido al azar tenga dos o
ms grietas.

6. Un ingeniero de transito desea disear un sistema de control de trfico. Estima que el


nmero medio de automviles por minuto que llegan a una interseccin es de 2. Que
probabilidad hay de que:
a. En un minuto dado, el nmero de llegadas sea de tres o ms.
b. El nmero de llegadas sea a lo ms 4.
7. En una central Telefnica se recibe en promedio 3 llamadas por minuto. Calcular la
probabilidad de que ocurran
a. Exactamente 4 llamadas en un minuto
b. A lo ms 5 llamadas en un minuto.
c. Por lo menos 4 llamadas en un minuto.
8. Supongamos que el coeficiente de friccin para cierto sistema de copiado tiene una
distribucin normal , con media igual a 0.55 y desviacin estndar igual a 0.013.
Durante el funcionamiento del sistema, se mide el coeficiente de friccin en un
momento escogido al azar.
a. Calcular la probabilidad de que el coeficiente de friccin est entre 0.53 y 0.56
b. Es verosmil observar un coeficiente de friccin por debajo de 0.50?
9. Una compaa de comunicacin por cable ha determinado que el nmero de
interruptores terminales de de botn solicitados diariamente tiene una distribucin
normal con una media de 200 y una varianza de 2500.
a. En que porcentaje de los das la demanda ser de menos de 90 interruptores.
b. En que porcentaje de los das la demanda estar entre 225 y 275 interruptores.
10. Encontrar:
a. P ( Z 2.15 )
b. P ( Z - 1.95 )
c. P ( -0.95 Z 1.75 )
d. P ( 2Z 2.86)
e. P ( | Z | 1.26
f. P ( -0.75 Z/ 2 1.05 )

BIBLIOGRAFIA
1. Canavos, G. Probabilidad y Estadstica. Aplicaciones y Mtodos
McGraw Hill, 1992.
2. Bury, K. Distribuciones Estadsticas para Ingenieros, Cambridge
University Press, New York, 1999.
3. Devore, J. Estadstica y Probabilidad para Ingeniera y Ciencias
International Thomson Editores, 1998.
4. Hoog, R. y Craig, J. Introduction to Mathematical Statistics, Prentice
Hall, 1995.
5. Meyer, P., Probabilidad y Aplicaciones Estadsticas,

Addison Wesley

Iberoamericana, Wilgminton, Delaware, 2002.


6. Miller, J.E. Freund y Johnson, R. Probabilidad y Estadstica para
Ingenieros, Prentice Hall Hispanoamericana, Mexico, 1992.
7. Montgomery, D. y Runger, G. Probabilidad y Estadstica Aplicada a la
Ingeniera, McGraw Hill ,1997.
8. Raymond, H., y Myers, S. Probabilidad y Estadstica para Ingenieros".
Sexta edicin. 1998
9. Ross, S. Introduccin a la Probabilidad y estadstica para Ingenieros,
John Wiley and Sons, New york, 2000.
10. Walpole, R. Estadstica Matemtica con Aplicaciones. Prentice Hall
Hispanoamericana S.A, 1998.

You might also like