Professional Documents
Culture Documents
APRENDIZAJE
MTODOS ESTADSTICOS
Mtodos estadsticos
NDICE
INTRODUCCIN
INSTRUCCIONES PARA EL USO DEL MANUAL
ESQUEMA GENERAL DE CONTENIDO
PRIMERA UNIDAD: Estadstica descriptiva
1. ESTADSTICA, VARIABLE Y ESCALA DE MEDICIN06
2. INVESTIGACIN ESTADSTICA, RECOLECCIN DE DATOS Y ORGANIZACIN
Y PRESENTACIN DE DATOS................................................................19
3. ORGANIZACIN Y PRESENTACIN DE DATOS CUANTITATIVOS...24
4. MEDIDAS DE TENDENCIA CENTRAL............................48
5. MEDIDAS DE DISPERSIN...61
SEGUNDA UNIDAD: Probabilidades e inferencia
6. PROBABILIDAD BSICA...69
7. DISTRIBUCIONES IMPORTANTES..81
8. TEORA DE MUESTREO...95
9. ESTIMACIN DE PARMETROS..109
TERCERA UNIDAD: Estadstica inferencial
10. PRUEBA DE HIPTESIS. 116
11. ANLISIS DE VARIANZA .. 147
12. REGRESIN LINEAL . 153
Pgina 2
Mtodos estadsticos
INTRODUCCIN
El presente mdulo ha sido concebido como un material de consulta para el
estudiante de la asignatura de Mtodos estadsticos.
El propsito de este producto es la exposicin de informacin acerca de teora
estadstica que le permita calcular indicadores que conlleven a tomar una decisin.
El desarrollo de los temas se realiz en torno a las sesiones comprendidas en el
slabo del curso, considerando de manera pertinente, un nivel de complejidad
creciente, sobr4e todo en los aspectos prcticos de cada tema.
Adems, cada captulo tiene presenta una introduccin, donde se explica, de
manera general, los objetivos del temas; luego abarca el desarrollo del contenido y
finalmente se plantean los ejemplos y problemas de aplicacin prctica resueltas.
En cuanto a la organizacin y presentacin del contenido, el mdulo se
conforma de la siguiente manera: en la sesin uno se estudian los concepto de
estadstica, variable y escala de medicin; en la sesin dos, investigacin estadstica,
recoleccin de datos y la representacin de una variable cualitativa con su respectiva
grfica; en la sesin tres, la organizacin y presentacin de datos para variable
cuantitativa; en la sesin cuatro, la medida de tendencia central; en la sesin cinco,
la medida de dispersin; en la sesin seis, la probabilidad bsica; en la sesin siete,
distribuciones importantes; en la sesin ocho, teora de muestreo; en la sesin nueve,
estimacin de parmetro; en la sesin 10, prueba de hiptesis; en la sesin 11, prueba
chi cuadrado; en la sesin 12, anlisis de varianza y en la sesin 13, anlisis de
regresin.
Finalmente, los docentes de la experiencia curricular Mtodos estadsticos
esperamos que este mdulo autoinstructivo de aprendizaje cumpla con su propsito y
sea de gran importancia y beneficio para el estudiante.
Pgina 3
Mtodos estadsticos
Pgina 4
Mtodos estadsticos
MTODO ESTADSTICO
ESTADSTICA
DESCRIPTIVA
ESTADSTICA,
VARIABLE Y
ESCALA DE
MEDICIN
INVESTIGACIN
ESTADSTICA,
RECOLECCIN
Y
ORGANIZACIN
Y
PRESENTACIN
DE DATOS
PRESENTACIN
DE DATOS
PROBABILIDADES
E INFERENCIA
ESTADSTICA
INFERENCIAL
APLICADA
PROBABILIDAD
BSICA
PRUEBA DE
HIPTESIS
DISTRIBUCIONES
IMPORTANTES
ANLISIS DE
VARIANZA
TEORA
DE
MUESTREO
REGRESIN
LINEAL
ESTIMACIN DE
PARMETROS
ORGANIZACIN
Y
PRESENTACIN
DE DATOS
CUANTITATIVOS
MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS DE
DISPERSIN
Pgina 5
Mtodos estadsticos
STATERA
STATUS
STAAT
Balanza
Situacin
Estado
Pgina 6
Mtodos estadsticos
3. HISTORIA
Los orgenes de la estadstica aunque son an desconocidos y no se sabe con
exactitud cundo se comenz a utilizar, la historia refleja que su us es muy antiguo
para el conteo de combatientes, para los impuestos, defunciones, estudio de recursos
naturales, pero fueron los romanos, maestros de la organizacin poltica, quienes
mejor supieron ocupar la estadstica, cada cinco aos realizaban un censo de la
poblacin, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales
para estudiar los avances del imperio y los recuentos de ganancias y las riquezas que
dejaban las tierras. Su uso soport las funciones tradicionales del gobierno central y
del Estado, como llevar registros sobre la situacin de la poblacin: nmero de
habitantes, nmero de nacimientos, nmero de defunciones, produccin, impuestos y
otros hechos contables y de control.
Seguidamente los hechos ms saltantes:
Egipcios
Datos de Administracin Estatal
Roma
Registros tributarios Empadronamiento (Ao 0)
rabes
Censo Estadsticas sistematizadas (Edad Media)
El Clero
Recopilacin, ordenamiento y estudio de datos demogrficos
Reyes Catlicos
Censo (siglo XVI) Censo del Marqus de la Ensenada 1748
Indias de Sevilla
Estadsticas Econmicas
Imperio Incaico
Registros demogrficos y socio econmicos mediante los Quipus
Alemania
Primera ctedra de Estadstica
4. ETAPAS DE LA ESTADSTICA
Pgina 7
Mtodos estadsticos
6. CULTURA ESTADSTICA
Refiere a dos componentes interrelacionados:
a) Capacidad para interpretar y evaluar crticamente la informacin estadstica, los
argumentos apoyados en datos que las personas pueden encontrar en diversos
contextos, incluyendo los medios de comunicacin, pero no limitndose a ellos.
b) Capacidad para discutir o comunicar sus opiniones respecto a tales
informaciones estadsticas cuando sea relevante
7. DEFINICIN
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar,
resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa de los mismos; as como de realizar inferencias a partir
de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.
La estadstica se clasifica en estadstica descriptiva y en estadstica inferencial.
Se denomina Estadstica Descriptiva al conjunto de mtodos estadsticos
que se relacionan con el resumen y descripcin de los datos, como tablas,
grficas y el anlisis mediante algunos clculos.
Se denomina Inferencia Estadstica al conjunto de mtodos con los que
hacen la generalizaciones o la inferencia sobre una poblacin utilizando una
muestra. La inferencia puede contener conclusiones que pueden no ser ciertas
en forma absoluta, por lo que es necesario que estas sean dadas con una
medida de confiabilidad conocida como probabilidad.
8. POR QU ESTUDIAR ESTADSTICA?
La estadstica, como la matemtica, constituye uno de los idiomas
esenciales para comunicarse en el mundo universal de la ciencia y la
tecnologa. La estadstica permite comprender con mayor facilidad la
bibliografa especializada. La mayora de los libros, estudios e investigaciones
especializada en economa, educacin, sociologa, medicina, psicologa, etc.,
contienen resultados basados en el anlisis estadstico.
Sin lugar a dudas, aquellos profesionales que no conozcan estadstica tendrn
serias dificultades para ser expertos en sus respectivos campo cientfico.
UCV Lima este
Pgina 8
Mtodos estadsticos
Pgina 9
Mtodos estadsticos
Pgina 10
Mtodos estadsticos
VARIABLE ESTADSTICA
1. DEFINICIN
Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms
valores o modalidades.
2. ELEMENTOS DE UNA VARIABLE
La identificacin y definicin de variables es la tarea ms delicada de
toda investigacin y del trabajo estadstico. Tngase presente que las variables
se deduce a partir de los objetivos de un estudio o investigacin. En
consecuencia, para tener xito en la seleccin de variables, es recomendable
distinguir los siguientes cinco elementos:
Nombre o denominacin de la variable
Definicin o conceptualizacin de la variable
Un conjunto de categora o niveles, que es definida por el investigador.
Las categora no son nica, lo mnimo es dos categoras y dependen de
los objetivos de la investigacin.
Procedimientos para categorizar o agrupar las unidades de anlisis
UCV Lima este
Pgina 11
Mtodos estadsticos
3. CLASIFICACIN DE LA VARIABLE
3.1 VARIABLE CUALITATIVA
Cuando expresa una cualidad, caracterstica o atributo, tiene carcter
cualitativo, sus datos se expresan mediante una palabra, es no numrico, y se
clasifican en variables cualitativa nominal y variables cualitativa ordinal.
a. Variable cualitativa nominal: Es aquella variable que permite clasificar a una
unidad elemental en una sola categora.
Ejemplo 4
Lugar de nacimiento
Color de ojos
Partidos polticos
b. Variable cualitativa ordinal: Es aquella variable que permite clasificar a una
unidad elemental en una sola categora, y a la vez expresa orden de jerarqua.
Ejemplo 5
Clase social
Grado de estudio
Grado dentro del mando militar
3.2 VARIABLE CUANTITATIVA
Cuando el valor de la variable se expresa por una cantidad, es de
carcter numrico. El dato o valor puede resultar de la operacin de contar o
medir. Las variables cuantitativas pueden ser discretas o continuas.
a. Variable cuantitativa discreta: Cuando el valor de la variable resulta de la
operacin de contar, su valor est representado solo por nmeros naturales.
Ejemplo 6
Nmeros de hijo por familia
Nmero de accidentes por das
Nmero de trabajadores por empresa
Variable cuantitativa continua: Es toda variable cuyo valor se obtiene por
medicin o comparacin con una unidad o patrn de medida. Las variables
continuas pueden tener cualquier valor dentro de su rango o recorrido, por
tanto se expresa por cualquier nmero real.
Pgina 12
Mtodos estadsticos
Ejemplo 7
reas de parcelas
Ingreso monetario
Produccin de maz
ESCALA DE MEDICIN
1. INTRODUCCIN
En estadstica medir es observar el valor que toma una variable
estadstica en un elemento de la poblacin, los valores de las variables, adems de
ser cualidad o cantidad, define niveles de medicin de las unidades estadsticas, estos
niveles de medicin son denominado escalas.
2. DEFINICIN
Se denomina escala de medicin a los distinto niveles de valores que la
variable estadstica asigna a las unidades estadsticas en estudio.
3. ESCALA NOMINAL
Se dice que los valores de una variable estadstica estn en el nivel de escala
nominal si estos solo clasifican a las unidades estadstica en iguales o diferentes.
Los valores cualitativos son como etiquetas que la variables asigna a las unidades
estadstica hacindolas iguales entre s o diferentes. Si se asigna nmero a estos
valores cualitativos no es posible realizar operaciones aritmticas.
El mtodo estadstico con datos obtenidos en escala nominal consiste
bsicamente en obtener el nmero de casos en cada modalidad y obtener la
moda.
4. ESCALA ORDINAL
Se dice que los valores de una variable estadstica estn en el nivel de escala
ordinal si estn en escala nominal y si adems ordenan a las unidades estadstica
por la caracterstica que se observa.
Los valores cualitativos de una variable en escala ordinal son los resultados
de un criterio para ordenar a las unidades estadstica. Si se asignara nmeros a tales
valores, no es posible realizar operaciones aritmtica, solo son vlidas las relaciones
de igualdad, de no igualdad y de orden.
Pgina 13
Mtodos estadsticos
Pgina 14
Mtodos estadsticos
ACTIVIDADES
1
Qu es la estadstica?
_______________________________________________________
_______________________________________________________
________________________________________________________________________
________________________________________________________________________
2 Qu es la inferencia estadstica?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
3
Pgina 15
Mtodos estadsticos
GLOSARIO
Estadstica.
Estadstica descriptiva
Estadstica inferencial.
Dato....
Variable
Variable cualitativa.
Variable cuantitativa...
Informacin..
Poblacin.
Unidad de anlisis..
Parmetro.
Muestra.
Estadgrafo...
Escala de razn...
Pgina 16
Mtodos estadsticos
AUTOEVALUACIN
1.
2.
3.
4.
5.
Qu es una muestra?
a) Es una parte de la poblacin
b) Es toda la poblacin
c) Es un nmero
d) Es una informacin
6.
Qu es la unidad de anlisis?
a) Es dato
b) Es un valor
c) Es una informacin
d) Es la mnima unida de la poblacin
7.
Qu es informacin?
a) Es un valor que resulta despus de un proceso matemtico
b) Es una muestra
c) Es una poblacin
d) Es una variable
Solucin
1.- c
2.- b
3.- d
4.- d
5. a
6.- d
7.- a
Pgina 17
Mtodos estadsticos
BIBLIOGRAFA
Pgina 18
Mtodos estadsticos
INVESTIGACIN ESTADSTICA
1. INTRODUCCIN
En esta sesin se estudiara las definiciones
de investigacin estadstica, as como los
procedimientos para elaborar una tabla de
frecuencia y los grficos respectivo para una
variable cualitativa sea nominal u ordinal.
2. DEFINICIN
La investigacin es un proceso de produccin de conocimiento cientficos;
es un proceso sistemtico a travs del cual se recogen datos e informacin de
la realidad objetiva para dar respuesta a las interrogantes que se plantean. No
hay investigacin grande o pequea, simplemente investigar es buscar respuesta
para plantear soluciones.
Cuando se aplica el mtodo cientfico al estudio de los problemas
econmicos se habla de investigacin econmica, asimismo se tiene investigacin
educativa, investigacin agropecuaria, etc. Toda investigacin requiere de datos,
sin datos no hay investigacin, entonces surge la necesidad de definir mtodos,
anlisis o tratamientos de datos, con el propsito de obtener algunas medidas
o indicadores que expresen la dimensin o niveles de la variable estudiada, es
decir, realizar la operacionalizacin de las variables. En este contexto la
estadstica surge como ciencia auxiliar de la investigacin, que por su naturaleza,
estructura y mtodos en este proceso, el anlisis estadstico tambin cumple con
los diversos paso de la investigacin.
3. OBJETIVO
El objetivo de la investigacin estadstica es descubrir respuestas a
determinada interrogantes a travs de la aplicacin de procedimientos cientficos.
El punto de partida de la investigacin es la existencia de un problema que
habr que definir, examinar, valorar, y analizar crticamente, para luego formular
y entender su solucin.
Pgina 19
Mtodos estadsticos
4. ETAPAS
La investigacin estadstica por su naturaleza, es fundamental de tipo
descriptiva; se preocupa de la confiabilidad, validez y significacin de los datos,
de la muestras as como los mtodos y tcnica de recoleccin y anlisis
estadstico.
La investigacin estadstica es un proceso donde se distinguen cinco etapas:
a. Planteamiento o preparacin
Pgina 20
Mtodos estadsticos
Debe ser sencilla, de modo que se puede caracterizar con facilidad, que los
encargados de la recopilacin no tengan duda en su identificacin.
Debe ser precisa, de modo que facilite su identificacin y saber que
observar.
Fcilmente compresible y adaptada a los objetivos que se persiguen.
Debe ser semejantes, de manera que sean aditivo
Respetar las posibles definiciones oficiales o estatales.
Pgina 21
Mtodos estadsticos
RECOLECCIN DE DATOS
1. DEFINICIN
La recopilacin o coleccin de datos es el
momento en el cual el investigador se pone en
contacto con los objetos o elementos sometidos a
estudio, con el propsito de obtener los datos o
respuesta de las variables consideradas; a partir de
estos datos se prepara la informacin estadstica, se
calcula medidas de resumen e indicadores para el
anlisis estadstico.
Antes de recopilar o recoger datos, es importante analizar los objetivos
del estudios, precisar las variables e identificar las fuentes de datos, a fin de
definir qu datos hay que recopilar y cmo hacer esta tarea.
La formulacin del problema y del marco terico, la definicin de las
hiptesis y de los objetivos de la investigacin permite especificar los tipos de
informacin y las variables que son requeridas. Realizada esta tarea, el
investigador debe a continuacin seleccionar y elaborar las tcnicas e
instrumentos para recolectar los datos.
El trabajo de recoleccin de datos, en general se puede realizar mediante
dos modalidades:
La tcnica de investigacin documental o bibliogrfica
La tcnica de trabajo de campo
La fase de recoleccin de datos es uno de los puntos principales de la
investigacin, en consecuencia, debe dotarse de ciertas garantas para que los
datos cientficos puedan ser confiables y comparables, evitar las desviaciones y
la falta de representatividad.
2. INFORMACIN ESTADSTICA
La informacin estadstica, como datos procesados de acuerdos a ciertos
objetivos, es un medio que permite cuantificar aspecto de una realidad, de un
fenmeno o problema determinado, en un momento o periodo dado y un
mbito concreto. A partir de la informacin estadstica se puede describir y
explicar esa realidad, as como inferir conclusiones para definir un plan de
accin o desarrollo especifico. La informacin, en general, sirve para tomar
decisiones.
Pgina 22
Mtodos estadsticos
3. FUENTES DE DATOS
Las fuentes de datos es el lugar, la institucin, las personas o elementos
donde estn o que poseen los datos que se necesitan para cada una de las
variables o aspecto de la investigacin o estudio.
En
Pgina 23
Mtodos estadsticos
Pgina 24
Mtodos estadsticos
Pgina 25
Mtodos estadsticos
con la palabra cuadro, por ejemplo cuadro N 3.3. Indica que es el tercer
cuadro del captulo tres.
b. Ttulo, es la descripcin resumida del contenido del cuadro, la redaccin del
ttulo debe ser breve, claro y completo de modo que se pueden deducir sin
ambigedad que tipo de informacin contiene el cuadro.
c. Concepto o encabezamiento, es la descripcin de las filas y columnas de
un cuadro estadstico, el encabezamiento se ubica en la parte superior del
cuerpo del cuadro. ndica las variables y sus categoras o intervalos, tambin
puede indicar un periodo de tiempo.
d. Cuerpo del cuadro, es el contenido numrico de los cuadros. Es la parte
donde se colocan los datos correspondientes a la caractersticas o variables
indicados en el encabezamiento o en los conceptos, es decir presenta la
distribucin de los elementos segn la clasificacin en categora de las
variables.
e. Notas de pie o llamadas, se usa para algunos trminos o siglas, y tambin
para indicar que elementos estn o no incluidos en algunos de los conceptos
del cuadro.
f. Fuentes, es la indicacin al pie del cuadro, que sirve para nombrar la
publicacin, entidad, estudio o fuentes de donde se obtuvieron los datos
utilizados para construir el cuadro. La identificacin de la fuente permite, si
fuera el caso, comprobar la informacin o para obtener informacin
complementaria.
Hay dos tipos de fuentes: primaria, cuando se obtiene directamente de la
unidad de anlisis o cuando se recurre a los propios formularios de una
encuesta; secundaria, cuando se recurre a documentos, boletines o cuadros
estadsticos publicados.
g. Nota de unidad de medida, se escribe debajo del ttulo original, se usa
cuando se abrevia la escritura de las cifras y para expresar en que unidades
estn expresada la variables.
h. Elaboracin, es una indicacin que se coloca debajo de la fuente y sirve para
mencionar el responsable, que utilizando datos originales o de la fuente,
elabor el cuadro estadstico final; indicando la responsabilidad de la publicacin
del cuadro.
3. ELEMENTOS DE UNA TABLA DE FRECUENCIAS
a. Valor de la variable o intervalo de clases: Resulta de la clasificacin o
categorizacin de variable.
Pgina 26
Mtodos estadsticos
de
acumular
Fk f i f 1 f 2 ...... f k
i 1
H k hi h1 h2 ...... hk
i 1
Pk pi p1 p 2 ...... p k
i 1
Pgina 27
Mtodos estadsticos
C1
f1
h1
p1
C2
f2
h2
p2
C3
f3
h3
p3
C4
f4
h4
p4
Pgina 28
Mtodos estadsticos
SOLUCIN
TABLA DE DISTRIBUCIN DE FRECUENCIA DEL COLOR DE BEBIDA GASEOSA
BLANCO
12
0,40
40%
ROJO
10
0,33
33%
NEGRO
0,27
27%
COLOR DE BEBIDA
27%
40%
33%
BLANCO
ROJO
NEGRO
Pgina 29
Mtodos estadsticos
ACTIVIDADES
1. Al investigar el nivel socioeconmico en las modalidades: bajo (B), medio
(M), alto (A) de 50 familia, se obtuvo los siguientes datos:
si
no
si
no
no
si
si
no
si
si
si
no
no
si
no
no
si
no
no
si
no
si
si
no
no
si
no
no
no
no
Pgina 30
Mtodos estadsticos
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
Pgina 31
Mtodos estadsticos
GLOSARIO
Operacionalizacin: .
Fuente de datos:
Observacin: ..
Documento:
Entrevista: ..
Encuesta:
Cuestionario: .
Codificacin: .
Tabla de frecuencia: ..
Frecuencia absoluta: ..
Frecuencia relativa:
Frecuencia porcentual: ..
Pgina 32
Mtodos estadsticos
AUTOEVALUACIN
1. Quin produce el conocimiento cientfico?
a) El estadstico
c) El investigador
b) El matemtico
d) El encuestador
2.
3.
2 .- a
3 .- b
4 .- a
5 .- c
6 .- a
7.- d
Pgina 33
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 34
Mtodos estadsticos
1. INTRODUCCIN
En
esta sesin los
alumno conocern los
procedimiento matemtico que se debe seguir
para
elaborar una tabla de frecuencia y grafico para una
variable cuantitativa.
2. TABLA
DE
FRECUENCIA
CUANTITATIVA DISCRETAS
GRFICOS
PARA
VARIABLE
x1
f1
h1
p1
F1
H1
P1
x2
f2
h2
p2
F2
H2
P2
x3
f3
h3
p3
F3
H3
P3
x4
f4
h4
p4
F4
H4
P4
Pgina 35
Mtodos estadsticos
EJEMPLO 1
Construir la distribucin de frecuencia y grfico del nmero de hijos por
familia en una muestra de 30 hogares, si se han observado los siguientes datos:
SOLUCIN
X = nmero de hijo por familia
X = 0, 1, 2, 3, 4
Frecuencia absoluta
f1 3
f2 8
f4 4
f3 6
f5 9
Frecuencia relativa
h1
3i
0.10
30
h2
8i
0.27
30
h4
4i
0.13
30
h5
9i
0.30
30
h3
6
0.20
30
Frecuencia porcentual
Pgina 36
Mtodos estadsticos
F1 f i 3
i 1
F2 f i 3 8 11
i 1
F3 f i 3 8 6 17
i 1
F4 f i 3 8 6 4 21
i 1
F5 f i 3 8 6 4 9 30
i 1
H 1 hi 0.10
i 1
Pgina 37
Mtodos estadsticos
k
P1 p i 10%
i 1
0,10
10%
0,10
10%
0,27
27%
11
0,37
37%
0,20
20%
17
0,57
57%
0,13
13%
21
0,70
70%
0,30
30%
30
1,00
100%
Pgina 38
Mtodos estadsticos
1. TABLA
DE
CONTINUA
FRECUENCIA
PARA
VARIABLE
CUANTITATIVA
LMITES X
L1 - L2
x1
f1
h1
p1
F1
H1
P1
L2 - L3
x2
f2
h2
p2
F2
H2
P2
L3 - L4
x3
f3
h3
p3
F3
H3
P3
L4 - L5
x4
f4
h4
p4
F4
H4
P4
Pgina 39
Mtodos estadsticos
EJEMPLO 2
Construir la distribucin de frecuencia de los ingresos quincenales de 50
personas si los datos recopilados son:
63
23
10
59
53
89
53
72
60
65
64
36
70
52
67
76
49
57
51
61
57
44
56
62
62
67
73
64
43
85
60
61
56
59
68
71
67
62
35
56
62
61
51
63
78
26
55
81
60
99
L1 MIN 10
L2 10 13 23
L3 23 13 36
L4 36 13 49
L5 49 13 62
L6 62 13 75
L7 75 13 88
L8 88 13 101
Pgina 40
Mtodos estadsticos
X = MARCA DE CLASE =
Li Li 1
2
X1
10 23
16.5
2
X2
23 36
29.5
2
X3
36 49
42.5
2
X4
49 62
55.5
2
X5
62 75
68.5
2
X6
75 88
81.5
2
X7
88 101
94.5
2
10 A 23
16,5
0,02
2%
0,02
1%
23 A 36
29,5
0,06
6%
0,08
8%
36 A 49
42,5
0,06
6%
0,14
14%
49 A 62
55,5
20
0,40
40%
27
0,54
54%
62 A 75
68,5
17
0,34
34%
44
0,88
88%
75 A 88
81,5
0,08
8%
48
0,96
96%
88 A 101
94,5
0,04
4%
50
1,00
100%
INGRESO QUINCENAL
25
10 A 23
20
23 A 36
36 A 49
15
49 A 62
10
62 A 75
75 A 88
88 A 101
0
1
Pgina 41
Mtodos estadsticos
ACTIVIDADES
1. Al averiguar el nmero de hijos de 50 empleados que estn registrado en
los archivos de una empresa se obtuvo los siguientes datos:
Pgina 42
Mtodos estadsticos
11
15
36
25
17
39
19
75
101
125
27
18
29
33
20
30
37
79
105
129
28
41
33
22
10
26
27
82
109
138
34
12
27
31
25
46
24
85
112
140
14
18
26
35
24
23
31
90
116
142
18,4
12,3
11,2
11,2
30,2 21,3
25,1
15,3
26,8 22,7
11,2
15,8
15,1
14,7
12,5
12,3
25,3
8,3
22,3
12,2
24,6 16,2
15,9
15,8
26,4
18,2
22,7 22,4
14,3
20,5 21,9
13,4
15,5
12,1
20,3 30,1
21,3
28,9
35,2
23,1
29,3 34,2
Pgina 43
Mtodos estadsticos
35.6
31.1
30.1
30.5
33.5
27.9
31.6
28.7
31.3
30.5
29.3
28.1
33.2
24.9
30.6
31.5
33.7
30.5
26.8
35.1
22.5
32.1
27.9
29.9
28.6
34.2
28.5
31.2
28.7
30.1
34.2
27.5
29.5
30.4
30.3
32.7
29.8
28.7
31.3
29.6
20,5
21,9
13,4
15,5
28,9
12,1
20,3
30,1
29,3
34,2
0,05
3,11
5,64
7,83
1,51
4,23
5,98
7,88
2,53
4,56
6,36
7,99
9,63
3,23
4,89
6,54
8,52
9,52
3,24
5,23
6,87
8,35
Pgina 44
Mtodos estadsticos
GLOSARIO
Encuesta: ..
Cuestionario: ...
Codificacin:
Frecuencia relativa: .
Grfico de la escalera:
Polgono de frecuencia: .
Pgina 45
Mtodos estadsticos
AUTOEVALUACIN
1. El consumo mensual de agua ( en metros cbicos) de ochenta fbricas se
tabul en una distribucin de frecuencia simtrica de 7 intervalos de
amplitud iguales a tres. Siendo la marca de clase del cuarto intervalo
igual a 19. si las frecuencias del primer y tercer intervalo son iguales a
5% y 15% del total respectivamente y si la quinta frecuencia acumulada
es de 85% del total. Reconstruir la distribucin de frecuencia
y los
grficos respectivos.
2. Los tiempos de vida til (en das) de un producto se tabularon en una
distribucin de frecuencia de 5 intervalos de igual amplitud con
frecuencia relativa acumulada 0.10, 0.25, 0.55, 0.80, 1.00 . Determine la
distribucin de frecuencia absolutas si la tercera frecuencia absoluta
acumulada es 11, si la segunda marca de clase es 10 y el lmite inferior
del cuarto intervalo es 16.
3. Los tiempo de vida til de un tipo de batera, se tabul en una distribucin
de frecuencia de 5 intervalos de igual amplitud con frecuencia relativa
acumuladas: 0,10 , 0,25 , 0,55 , 0,80 , 1.00. determine la distribucin de
frecuencia absolutas si la tercera frecuencia absoluta acumulada es 11, si la
segunda marca de clase es 6 y si el lmite inferior del cuarto intervalo es 12.
4. La nota de un examen aplicado a obreros de una fbrica se tabul en una
distribucin de frecuencia relativa de 3 intervalos de amplitud iguales a 5, la
nota mnima es 5 y el 48% de las notas son menores que 12, y si el 80%
de las notas son inferiores a 16. Reconstruir la distribucin de frecuencia.
Pgina 46
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
3. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
6. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
Pgina 47
Mtodos estadsticos
1. INTRODUCCIN
Son estadgrafos que describen la posicin que ocupan una distribucin
de frecuencia alrededor de un valor de la variables.
Los estadgrafos son valores que de manera condensada representa en un
solo valor a una serie de datos y adems describen resumidamente el conjunto
de observaciones.
Los estadgrafos de posicin de uso ms frecuente
mediana, la moda, los deciles, cuartiles y percentiles.
son: la media, la
2. LA MEDIANA
La mediana o valor mediano de una serie de valores observado es el
numero que separa a la serie de datos ordenados en formas creciente en dos
partes iguales.
La mediana es una medida de posicin que depende del nmero de
datos observado y no de su valores de estos datos.
2.1 MEDIANA PARA DATOS NO TABULADOS
Para calcular la mediana para datos no tabulados se obtiene bajo el siguiente
criterio:
Cuando n es impar
ME X n 1
2
Ejemplo 1
Cuando n
Ejemplo 2
es par
X n / 2 X n 2 / 2
2
ME
X n / 2 X n 2 / 2
2
X 4 X 5 7 13
10
2
2
Pgina 48
Mtodos estadsticos
11
17
21
30
Fi 1
ME Li A 2
Fi Fi 1
Ejemplo 4
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la mediana.
Pgina 49
Mtodos estadsticos
INTERVALOS
10
23
23
36
36
49
49
62
20
27
62
75
17
44
75
88
48
88 101
50
Fi 1
49 13 25 7 55.32
ME Li A 2
Fi Fi 1
44 7
3. LA MODA
La moda de una serie de datos es aquel valor que se repite con mayor
frecuencia. Este promedio se usa cuando se requiere sealar el valor ms
comn de una serie de datos. La moda es una medida menos importante que
la mediana debido a su ambigedad. La moda no siempre existe y si existe,
no siempre es nica.
3.1 MODA PARA DATOS NO TABULADOS
Ejemplo 5
Sera el valor que se repite el mayor nmero de veces
5, 8, 8, 8, 8, 8, 8, 11, 15, 15, 15, 15,
entonces la moda sera 8 .
Pgina 50
Mtodos estadsticos
MO Li A
d
d
1
2
con intervalo
se
Ejemplo 7
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la moda.
INTERVALOS
10
23
23
36
36
49
49
62
20
62
75
17
75
88
88 101
d1
17
49 13
MO Li A
60.55
17 3
d1 d 2
El ingreso quincenal ms frecuente es 60.55 .
UCV Lima este
Pgina 51
Mtodos estadsticos
4. MEDIA ARITMTICA
La media aritmtica se denomina simplemente media y comnmente se le
conoce como promedio, la media es el estadgrafo ms importante; se define y
calcula dividiendo la suma de los valores de la variables entre el nmero de
observaciones o valores.
___
i 1
Ejemplo 8
Hallar la media de las siguientes edades: 15, 16, 18, 15, 25.
n
___
i 1
89
17.8
5
__
i 1
f i xi
n
Ejemplo 9
Hallar el nmero promedio de hijos por familia.
Pgina 52
Mtodos estadsticos
k
__
Solucin:
i 1
f i xi
n
71
2.36
30
__
f
i 1
xi
Ejemplo 10
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar el promedio.
f
INTERVALOS
10
23
23
36
36
49
49
62
20
62
75
17
75
88
88 101
___
__
y a x b
La media aritmtica de datos tabulados, se calcula tambin utilizando las
frecuencia relativas.
Pgina 53
Mtodos estadsticos
__
x xi hi
i 1
__
__
n x
i 1
k
n
i 1
NOTA
La media aritmtica como estadgrafo de posicin de una distribucin
proporciona una idea de la posicin de los valores alrededor de la media.
La media es un valor promedio, por tanto no significa que todos los
valores observados resultan ser iguales.
La media siempre est influenciada por los valores extremos, sean mayores
o menores.
La media aritmtica no divide en dos partes iguales a un conjunto de
datos.
5. CUARTILES
Los cuartiles son los estadgrafos que divide a un conjunto de datos en
cuatro partes iguales y en total son tres cuartiles; se calcula utilizando la siguiente
frmula:
kn
Fi 1
k = 1, 2, 3
QK Li A 4
Fi Fi 1
Ejemplo 11
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el primer cuartil.
INTERVALOS
10 23
23 36
36 49
49 62
62 75
75 88
88 101
F
1
3
3
20
17
4
2
F
1
4
7
27
44
48
50
Pgina 54
Mtodos estadsticos
kn
Fi 1
36 13 12.5 7 39.58
Q K Li A 4
Fi Fi 1
27 7
INTERVALOS
10
23
23
36
36
49
49
62
20
27
62
75
17
44
75
88
48
88 101
50
3n
Fi 1
62 13 37.5 27 65.68
Q3 Li A 4
Fi Fi 1
44 7
6. DECILES
Es el estadgrafo que divide a un conjunto de datos en 10 partes iguales; se
calcula mediante la siguiente frmula:
kn
Fi 1
DK Li A 10
Fi Fi 1
Ejemplo 13
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el decil 8.
Pgina 55
Mtodos estadsticos
INTERVALOS
10
23
23
36
36
49
49
62
20
27
62
75
17
44
75
88
48
88 101
50
kn
Fi 1
62 13 40 27 71.94
D K Li A 10
Fi Fi 1
44 27
Fi 1
100
PK Li A
Fi Fi 1
Ejemplo 14
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el percentil 35.
INTERVALOS
10
23
23
36
36
49
49
62
20
27
62
75
17
44
75
88
48
88 101
50
Pgina 56
Mtodos estadsticos
kn
Fi 1
49 16 17.5 7 55.83
PK Li A 100
Fi Fi 1
27 7
ACTIVIDADES
1. La inversin anual, en miles de dlares, de una muestra de 50 fbrica en
compra de insumo estn distribuido en la siguiente tabla de frecuencia. Hallar
las medidas de tendencia central.
INTERVALOS
20 -
50
12
50 -
80
80 - 110
110 - 140
15
140 - 170
10
INTERVALOS
21,3 - 24,3
24,3 - 27,3
10
27,3 - 32,3
15
32,3 - 37,3
10
37,3 - 42,3
10
Pgina 57
Mtodos estadsticos
8,56
9,00
8,63
9,60
9,00
8,56
9,5
9,46
7,52
9,99
8,00
9,53
9,77
9,54
7,56
9,20
8,56
9,36
8,56
de
10
10
la
Pgina 58
Mtodos estadsticos
GLOSARIO
Mediana: .
Moda: .
Media: .
Percentiles: ..
Cuartiles: ..
Deciles: .
Asimetra positiva: ..
Asimtrica negativa: ..
AUTOEVALUACIN
1. Los egresos de una empresa varan de 3000 a 8000 soles distribuido en
forma simtrica en cinco intervalos de igual amplitud, con el 15%, 20%
y 30% de casos en el primer, segundo y tercer intervalo
respectivamente. Calcule el egreso promedio
2. En un examen de estadstica participaron tres grupos A, B y C con un total de
180 alumnos; habiendo obtenidos nota promedio general de 72 puntos. Los
puntajes promedio de los grupos A y B fueron 75 y 62, y estaba constituido
por 80 y 60 alumnos respectivamente. Cul es la nota promedio del grupo
C?
3. En el control de calidad de 120 lotes de determinado producto, se observ
el nmero de artculos defectuosos por lote, obteniendo los siguientes
resultados: el 5% de los lotes no tiene artculos defectuoso, el 15% tiene un
defectuoso, el 25% tiene 2 defectuosos, el 45% tiene 3 defectuosos y el
resto contiene 4 defectuoso.
Pgina 59
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 60
Mtodos estadsticos
MEDIDA DE DISPERSIN
1. INTRODUCCIN
Las medidas de tendencia central no son suficientes para describir un conjunto
de valores de alguna variable estadstica. Los promedios determinan el centro, pero
nada indica de cmo estn situados los datos respecto al centro.
En primer lugar, se necesita una medida de nivel de dispersin o la
variabilidad de los datos con respecto a su centro con la finalidad de ampliar la
descripcin de los datos o de comparar dos o ms serie de datos.
En segundo lugar , se necesita una medida de grado o nivel de la asimetra o
la deformacin en ambos lados del centro de una serie de datos, con el fin de
describir la forma de la distribucin de los datos. Esta medida se denomina ndice
de asimetra.
En tercer lugar, se necesita una medida que nos permita comparar el
apuntamiento o curtosis de distribucin simtrica con respecto a la distribucin
simtrica normal. Esta medida se denomina ndice de apuntamiento o curtosi.
2. DEFINICIN
Las medidas de dispersin o variabilidad son nmeros que miden el
grado de separacin de los datos con respecto a un valor central, que
generalmente es la media aritmtica.
Las principales medidas de dispersin son:
El
El
La
La
El
rango
rango intercuartil
varianza
desviacin estndar
coeficiente de variacin
3. RANGO O RECORRIDO
El rango o recorrido, de una serie de datos, es la diferencia entre sus
valores mximo y mnimo.
R = max min
El rango es una medida de dispersin muy fcilmente calculable, pero es
muy inestable, ya que depende nicamente de los dos valores extremos. Su
valor puede cambiar grandemente si se aade o elimina un solo dato. Por
tanto su uso es muy limitado.
UCV Lima este
Pgina 61
Mtodos estadsticos
4. RANGO INTERCUARTIL
El rango intercuartil, es la diferencia entre sus cuartiles tercero y
primero.
RI = Q3 Q1
El rango intercuartil es una medida que excluye el 25% ms alto y el
25% ms bajo, dando un rango dentro del cual se encuentra el 50% central
de los datos observados y a diferencia del rango total no se encuentra
afectada por los valores extremos.
5. LA VARIANZA
La varianza, es una medida que cuantifica el grado de dispersin o de
variacin de los valores de una variable cuantitativa con respecto a la media
aritmtica. Si los valores tienden a concentrarse alrededor de su media, la
varianza ser pequea. Si los valores tiende a distribuirse lejos de la media, la
varianza ser grande.
La varianza es la media aritmtica de los cuadrados de las diferencia de
los datos con respecto a su media aritmtica.
a. La varianza para datos no tabulados
n
( xi U ) 2
i 1
X
i 1
2
i
Ejemplo 1
Hallar la varianza al siguiente conjunto de datos 5, 8, 12, 19, 14.
b. La Varianza para datos tabulados (sin intervalo)
n
i 1
fi (X i U )2
N
i 1
X i2 f i
N
Ejemplo 2
Hallar la varianza de la tabla siguiente, que representa el nmero de hijos por
familia.
X
f
0
3
1
8
2
6
3
4
4
9
UCV Lima este
Pgina 62
Mtodos estadsticos
i 1
fi (X i U )2
N
i 1
X i2 f i
N
Ejemplo 3
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la varianza.
INTERVALOS
10
23
23
36
36
49
49
62
20
62
75
17
75
88
88 101
Propiedades de la varianza
Pgina 63
Mtodos estadsticos
C.V
* 100%
Varianza
Desviacin estndar
X
i 1
S2
i 1
n 1
DATOS AGRUPADOS
K
2
UCV Lima este
X
i 1
U . fi
S2
m
i 1
x . fi
2
n 1
Pgina 64
Mtodos estadsticos
ACTIVIDADES
1.
INTERVALOS
21,3 - 24,3
24,3 - 27,3
10
27,3 - 32,3
15
32,3 - 37,3
10
37,3 - 42,3
10
10 - 20
20
20 - 30
30
30 - 40
10
40 - 50
15
50 - 60
25
INTERVALOS
0 - 4
4 - 8
10
8 - 12
12 - 16
15
16 - 20
15
Pgina 65
Mtodos estadsticos
N
empleados
11
13
20
17
12
6
4
2
20 -
50
12
50 -
80
80 - 110
110 - 140
15
140 - 170
10
Pgina 66
Mtodos estadsticos
GLOSARIO
Rango:
Intercuartil: .
Varianza: .
Desviacin estndar: .
Coeficiente de variacin: .
Homogneo: ..
Heterogneo: .
AUTOEVALUACIN
1. En un test aplicado a 100 personas se obtuvo la siguientes informacin: los
puntajes se tabularon en una distribucin de frecuencia simtrica de 5
intervalos de amplitud iguales, siendo el puntaje mnimo 40 y el mximo
de 90. la frecuencia absoluta del intervalo central fue de 40 y del quinto
de 10. calcular la varianza.
2. Una prueba de conocimiento, A se calific sobre 20 puntos dando una
media de 12 y una desviacin estndar de 2 puntos. Mientras que una
prueba de aptitud ,B se calific sobre 100 puntos, dando una media de
70 y una desviacin estndar de 5 En cul de las dos pruebas los
puntajes son ms homogneos?
3. Los sueldo de 150 trabajadores de una empresa tiene un coeficiente
variacin del 5% en el mes de agosto. para el mes de septiembre hay
aumento a cada trabajador el 20% de su sueldo ms una bonificacin
60$ y el coeficiente de variacin baja a 4%. Calcular la media y
desviacin estndar de los sueldos del mes de agosto.
de
un
de
la
Pgina 67
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 68
Mtodos estadsticos
PROBABILIDAD BSICA
1. EXPERIMENTO
Es un proceso mediante el cual
resultado de una observacin.
se obtiene un
con
exactitud
los
un dado
una moneda tres veces
una moneda tantas veces hasta que aparezca la primera cara
la vida til en horas de una marca de artefacto elctrico
Pgina 69
Mtodos estadsticos
2. ESPACIO MUESTRAL:
Se denomina espacio muestral al conjunto que contiene todos los
resultados posible de un experimento aleatorio.
Cada resultado posible de un experimento aleatorio es un elemento del
espacio muestral. A cada elemento del espacio muestral se denomina tambin
punto muestral. Esto es, el espacio muestral se describe por:
= / es un punto muestral
Si el espacio muestral tiene un numero finitos de elementos es posible
en listar a todos estos, y si el nmero de elementos es grande o infinito el
espacio muestral se describir mediante un enunciado o regla de
correspondencia.
Pgina 70
Mtodos estadsticos
S2
1,
2 , 3, 4 , 5 , 6
3. EVENTOS: A, B, C..Z
Se denomina evento a cualquier subconjunto de un espacio muestral.
3.1 CLASE DE EVENTOS
Los eventos se clasifican en:
Eventos imposible, es aquel que no tiene
puntos muestrales, en
consecuencia no ocurre nunca.
Eventos unitarios o elementales, w es aquel que contiene un solo
punto muestral.
Eventos compuestos, es el que consiste de dos o ms eventos.
Evento seguro o cierto, es el mismo espacio muestral, ya que es el
subconjunto que contiene a todos los eventos elementales.
1) E1 : Lanzamiento de una moneda.
S1 cara , sello c , s
Podremos plantear los siguientes eventos:
A1 = { c }
A2 = ______
Pgina 71
Mtodos estadsticos
2) E2 :Lanzamiento de un dado
S2
1,
2 , 3, 4 , 5 , 6
B1 = _______________________
B2 = _______________________
B3 = _______________________
c. Diferencia de evento
La diferencia del evento A menos B es el evento A B, que consiste
de todos los puntos mustrales que pertenecen al evento A y no pertenecen
al evento B.
A B = {w / w A w B}
d. Complemento de un evento
Si A est incluido en B entonces el complemento est formado por
aquellos elementos que estn fuera del conjunto A.
AC = {w B / w A}
e. Eventos disjuntos
Dos eventos A y B son mutuamente excluyentes o disjuntos, si no tiene
elementos en comn, esto es si, A B = .
3.3 PROBABILIDAD DE UN EVENTO
3.3.1 Definicin de probabilidad
La probabilidad de un evento es la razn entre el nmero de casos
favorables y el nmero total de casos posibles.
Pgina 72
Mtodos estadsticos
# de resultados favorables
DEFINICIN DE PROBABILIDAD
Probabilidad de un evento =
# de resultados posibles
CLSICA
PA
nA
n
0.5
Tan probable
como improbable
1
Certeza
de ocurrir
P() = 1
Para cualquier numero finito k de eventos mutuamente excluyentes en ,
entonces
K K
P Ai PAi
i 1 i 1
3.4 TEOREMA
Si es el evento imposible, entonces P() = 0
Para cada evento A, se cumple que P(AC) = 1 P(A)
A y B son eventos tales que A esta dentro de B, entonces P(A) P(B)
Si A y B son dos eventos cualquiera en entonces
P A B P( A) P( B) P( A B)
Ejemplo
Consideremos el lanzamiento de
probabilidad de Obtener suma 7
un
dado dos
veces. Calcular
la
Ejemplo
Se tiene el siguiente experimento aleatorio
Pgina 73
Mtodos estadsticos
P(A
Pgina 74
Mtodos estadsticos
EJEMPLO
Se lanzan dos dados. Si la suma ha sido 7, cul es la probabilidad de que alguno de
los dados haya salido un tres?
Sean los sucesos:
A= "la suma de los puntos es siete"
B = "en alguno de los dados ha salido un tres"
El suceso B /A es salir en algn dado 3, si la suma ha sido 7.
Observamos que esta situacin ocurre en las parejas (3 , 4) y (4 , 3) . Por tanto,
P (B / A) = 1 / 3
EJEMPLO
Se tiene la siguiente informacin:
Especialidad /
Sexo
Varones
Mujeres
Total
Ciencias
42%
28%
70%
Letras
12%
18%
30%
Total
54%
46%
100%
(A 1 , A 2 , .. ., A n ) tales que
Pgina 75
Mtodos estadsticos
Sea A1, A2, ...,An un sistema completo de sucesos tales que la probabilidad de cada uno
de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las
probabilidades condicionales P(B/Ai), entonces la probabilidad del suceso B viene dada
por la expresin:
Ejemplo
Una compaa dedicada al transporte pblico explota tres lneas de una ciudad, de
forma que el 60% de los autobuses cubre el servicio de la primero lnea, el 30% cubre
la segunda y el 10% cubre el servicio de la tercera lnea. Se sabe que la probabilidad
de que, diariamente, un autobs se avere es del 2%, 4% y 1%, respectivamente, para
cada lnea. Determina la probabilidad de que, en un da, un autobs sufra una avera.
Solucin:
El suceso "sufrir una avera" (Av) puede producirse en las tres lneas, (L1, L2, L3). Segn
el teorema de la probabilidad total y teniendo en cuenta las probabilidades del
diagrama de rbol adjunto, tenemos:
P(Av) = P(L1) P(Av/L1) + P(L2) P(Av/L2) + P(L3) P(Av/L3) =
= 0.6 0.02 + 0.3 0.04 + 0.1 0.01 =
= 0.012 + 0.012 + 0.001 = 0.025
Ejemplo 22
Una empresa del ramo de la alimentacin elabora sus productos en cuatro factoras:
F1, F2, F3 y F4. El porcentaje de produccin total que se fabrica en cada factora es del
40%, 30%, 20% y 10%, respectivamente, y adems el porcentaje de envasado
incorrecto en cada factora es del 1%, 2%, 7% y 4%. Tomamos un producto de la
empresa al azar. Cul es la probabilidad de que se encuentre defectuosamente
envasado?
UCV Lima este
Pgina 76
Mtodos estadsticos
Solucin:
Ejemplo
Tres mquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de
las piezas producidas en una fbrica. Los porcentajes de produccin defectuosa de
estas mquinas son del 3%, 4% y 5%.
Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de
haber sido producida por la mquina B.
Qu mquina tiene la mayor probabilidad de haber producido la citada pieza
defectuosa?
Solucin:
Pgina 77
Mtodos estadsticos
B) = P(A) . P(B)
Pgina 78
Mtodos estadsticos
EJERCICIOS PROPUESTOS
Habilidad
Escasa
Promedio
Mucho
TOTAL
Escaso
40
15
5
60
Inters
Promedio
8
17
10
35
Mucho
12
18
25
55
TOTAL
60
50
40
150
Pgina 79
Mtodos estadsticos
Pgina 80
Mtodos estadsticos
DISTRIBUCIONES IMPORTANTES
1. DISTRIBUCIN NORMAL
Esta distribucin es frecuentemente utilizada
en las aplicaciones estadsticas. Su propio nombre
indica su extendida utilizacin, justificada por la
frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya
grfica tiene forma de campana.
Se dice que la variable aleatoria X es continua cuando toma valores reales
desde el
- < x< y se dice que se distribuye normalmente con media y
variancia 2 .
X ~ N (, 2)
Pgina 81
Mtodos estadsticos
Pgina 82
Mtodos estadsticos
P(Z a)
P(Z > a) = 1 - P( Z a)
P(Z a) = 1 P(Z a)
Pgina 83
Mtodos estadsticos
Ejemplos.
1) Determinar la probabilidad de cada una de las siguientes expresiones:
a) P ( Z < 1.25 )
c) P (Z < 0 )
e) P ( -2.38 < Z < 0 )
g) P (1.55 < Z < 2.35)
b) P ( Z< -2.28)
d) P ( 0 < Z < 2.5 )
f) P ( - 2.25 < Z < 2.25 )
h ) P ( Z > 2.43 )
b) El 95,5% de la poblacin
Solucin.-
c) El 99,7% de la poblacin
Solucin.UCV Lima este
Pgina 84
Mtodos estadsticos
Ejemplo
La longitud a que se puede estirar sin rotura un filamento de Nylon es una
variable aleatoria con media 5000 pies y desviacin estndar 5000. Cul es la
probabilidad que la longitud promedio de 100 filamento este comprendido entre
4750 y 5500?
Pgina 85
Mtodos estadsticos
2. DISTRIBUCIN T STUDENT
Sea Z una variable aleatoria normal con media 0 y varianza 1 sea, sea Y
una variable aleatoria que tiene una distribucin Chi - cuadrado con r grado de
libertad, y si Y e Z son independiente, entonces la variable aleatoria.
Z
Y /r
PTr a p
r = grado de libertad
a = cuantil
p = probabilidad
Ejemplo a.
Hallar la probabilidad P (T5< 2,571) = p
Ejemplo b.
Hallar el grado de libertad P (Tr< 1,812) = 0,95
Ejemplo c.
Hallar el cuantil P (T8< a) = 0,95
2.1 TABLA DE LA DISTRIBUCIN t- Student
c t1, r
La tabla da reas 1
y valores
, donde, P[T c] 1 , y donde T
tiene distribucin t-Student con r grados de libertad.
Pgina 86
Mtodos estadsticos
1
r
0.75
0.80
0.85
0.90
0.95
0.975
0.99
0.995
1.000
1.376
1.963
3.078
6.314
12.706
31.821
63.657
0.816
1.061
1.386
1.886
2.920
4.303
6.965
9.925
0.765
0.978
1.250
1.638
2.353
3.182
4.541
5.841
0.741
0.941
1.190
1.533
2.132
2.776
3.747
4.604
0.727
0.920
1.156
1.476
2.015
2.571
3.365
4.032
0.718
0.906
1.134
1.440
1.943
2.447
3.143
3.707
0.711
0.896
1.119
1.415
1.895
2.365
2.998
3.499
0.706
0.889
1.108
1.397
1.860
2.306
2.896
3.355
0.703
0.883
1.100
1.383
1.833
2.262
2.821
3.250
10
0.700
0.879
1.093
1.372
1.812
2.228
2.764
3.169
11
0.697
0.876
1.088
1.363
1.796
2.201
2.718
3.106
12
0.695
0.873
1.083
1.356
1.782
2.179
2.681
3.055
13
0.694
0.870
1.079
1.350
1.771
2.160
2.650
3.012
14
0.692
0.868
1.076
1.345
1.761
2.145
2.624
2.977
15
0.691
0.866
1.074
1.341
1.753
2.131
2.602
2.947
16
0.690
0.865
1.071
1.337
1.746
2.120
2.583
2.921
17
0.689
0.863
1.069
1.333
1.740
2.110
2.567
2.898
18
0.688
0.862
1.067
1.330
1.734
2.101
2.552
2.878
19
0.688
0.861
1.066
1.328
1.729
2.093
2.539
2.861
20
0.687
0.860
1.064
1.325
1.725
2.086
2.528
2.845
21
0.686
0.859
1.063
1.323
1.721
2.080
2.518
2.831
22
0.686
0.858
1.061
1.321
1.717
2.074
2.508
2.819
23
0.685
0.858
1.060
1.319
1.714
2.069
2.500
2.807
24
0.685
0.857
1.059
1.318
1.711
2.064
2.492
2.797
25
0.684
0.856
1.058
1.316
1.708
2.060
2.485
2.787
26
0.684
0.856
1.058
1.315
1.706
2.056
2.479
2.779
27
0.684
0.855
1.057
1.314
1.703
2.052
2.473
2.771
28
0.683
0.855
1.056
1.313
1.701
2.048
2.467
2.763
29
0.683
0.854
1.055
1.311
1.699
2.045
2.462
2.756
30
0.683
0.854
1.055
1.310
1.697
2.042
2.457
2.750
40
0.681
0.851
1.050
1.303
1.684
2.021
2.423
2.704
60
0.679
0.848
1.046
1.296
1.671
2.000
2.390
2.660
120
0.677
0.845
1.041
1.289
1.658
1.980
2.358
2.617
0.674
0.842
1.036
1.282
1.645
1.960
2.326
2.576
Pgina 87
Mtodos estadsticos
distribuidas
Se dice que e una variable aleatoria Chi - cuadrado con r grado de libertad
P X2 a p
r = grado de libertad
a = cuantil
p = probabilidad
Ejemplo
Hallar la probabilidad P (x24< 2,19) = p
Ejemplo
Hallar el grado de libertad P (x2r< 18,3) = 0,95
Ejemplo
Hallar el cuantil P (x26< a) = 095
Pgina 88
Mtodos estadsticos
Pgina 89
Mtodos estadsticos
Pgina 90
Mtodos estadsticos
Pgina 91
Mtodos estadsticos
Pgina 92
Mtodos estadsticos
PROBLEMAS PROPUESTOS
1) El ingreso monetario mensual por hogar en una regin se distribuye segn
el modelo de la probabilidad normal con media 600 y desviacin estndar
100 dlares. Qu porcentaje de hogares de la regin tienen ingreso
menores de 400?
2) La demanda diaria, en kilogramos, de un producto se distribuye segn el
modelo de la probabilidad normal con una media de 50 y una desviacin
estndar de 10. Cul es la probabilidad de que la demanda de un da
cualquiera este entre los 46 y 54 kilogramos?
3) Los resultados de un examen de comportamiento agresivo aplicado a 400
adolescentes se distribuye segn el modelo de la probabilidad normal con
una media igual a 35 puntos. Obtenga la desviacin estndar de la
distribucin si el 84.13% de los adolescentes obtiene al menos 30 puntos.
4) El ingreso monetario mensual por hogar en una comunidad se distribuye
segn el modelo de la probabilidad normal con una media de 400 y una
desviacin estndar de 50. todos los hogares que estn en el dcimo superior
de los ingreso mensuales pagan una contribucin de solidaridad, a partir de
que ingreso lo hacen?
5) Una pieza es considerada defectuosa y por lo tanto rechazada si su
dimetro es mayor que 2.02 cm. O es menor que 1.98 cm. Suponga que
los dimetros tienen distribucin normal con media de 2 cm. Y desviacin
estndar de 0.01 cm. Cuntas piezas de 10000 se espera que sean
rechazadas?
6) Los pesos de los posible usuarios de un ascensor constituye una poblacin
cuya distribucin normal con una media de 70 Kg. y una desviacin estndar
de 10 Kg. si el ascensor admite como peso mximo 585 kg. Cul es la
probabilidad que el peso total de 10 usuarios supere ese peso mximo?
7) El tiempo, en minuto que demora un operario en ensamblar un objetos es
una variable aleatoria X cuya distribucin tiene una media de 30 y una
desviacin estndar de 2. el objeto totalmente terminado requiere un
tiempo de x + 5 minutos. Si el operario tiene que entregar 36 objetos
totalmente terminado, calcule la probabilidad de que emplee un tiempo total
de al menos 20.5 horas.
8) Las llamadas que realiza un alumno por su telfono celular duran en
promedio tres minutos con una desviacin estndar de 0.05 minutos. Si el
costo por llamada tiene un valor fijo de 0.8 dlares ms un costo variable
Pgina 93
Mtodos estadsticos
Pgina 94
Mtodos estadsticos
TEORA DE MUESTREO
1. ESTADSTICA
Es la ciencia que se ocupa
de los mtodos y procedimientos
para recoger, clasificar, resumir, y
analizar datos, siempre y cuando
la variabilidad e incertidumbre sea
una causa de los mismos; as como
de realizar inferencias a partir de
ellos, con la finalidad de ayudar a
la toma de decisiones y en su caso
formular predicciones.
1.1 ESTADSTICA DESCRIPTIVA
Es el conjunto de mtodos estadsticos que se relacionan con el resumen
y descripcin de los datos, como tablas, graficas y el anlisis mediante algunos
clculos.
1.2 INFERENCIA ESTADSTICA
Es el conjunto de mtodos con lo cual se hace la generalizacin sobre
una poblacin utilizando una muestra. La inferencia puede contener conclusiones
que pueden no ser ciertas en forma absoluta, por lo que es necesario que
estas sean dadas con una medida de confiabilidad, el cual se le conoce como
probabilidad.
1.3 POBLACIN
Es el conjunto de elementos que contienen una o ms caracterstica
observable de naturaleza cualitativa o cuantitativa que se pueden medir en
ellos.
a. UNIDAD ELEMENTAL
Viene a ser cada elemento de la poblacin.
b. UNIDAD DE ANLISIS
Elemento del que hay que obtener la informacin.
Pgina 95
Mtodos estadsticos
1.4 VARIABLE
Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms
valores o modalidades.
1.5 DATO
Es el resultado de medir una caracterstica observable de una unidad de
anlisis.
1.6 INFORMACIN
Es el resultado que se obtiene al procesar un conjunto de datos.
1.7 PARMETRO
Se denomina parmetro a una medida descriptiva que resume una
caracterstica, calculada a partir de los datos observados en toda la poblacin.
1.8 MUESTRA
Se denomina muestra a una parte de la poblacin seleccionada de acuerdo
con un plan o regla, con el fin de obtener informacin acerca de la poblacin
de la cual proviene.
1.9 ESTADGRAFO
Se denomina estadgrafo a una medida descriptiva que resume una
caracterstica, calculada a partir de los datos observados en una muestra
aleatoria.
1.10 ERROR DE ESTIMACIN
Es la diferencia entre un estadstico y su parmetro correspondiente. Es una
medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor
de la poblacin, nos da una nocin clara hasta dnde y con qu probabilidad una
estimacin basada en una muestra se aleja del valor que se hubiera obtenido por
medio de un censo completo. Siempre se comete un error, pero la naturaleza de la
investigacin nos indicar hasta qu medida podemos cometerlo.
1.11 MUESTREO
Evaluar el comportamiento de una o varias caractersticas o variables de una
poblacin sera muy costoso, por lo que la estadstica nos brinda procedimientos para
seleccionar a una parte de esa poblacin y analizarla de tal forma que sus
caractersticas coincidan con la poblacin. El muestreo es la seleccin de una parte
representativa de la poblacin que permita estimar los parmetros de la poblacin.
UCV Lima este
Pgina 96
Mtodos estadsticos
Pgina 97
Mtodos estadsticos
que fue S/. 7 000, esta diferencia de S/. 1 000 entre el valor de la muestra y el valor
de la poblacin constituye el error por muestreo.
La presencia del error por muestreo parecera indicar que el estudiar una
muestra en vez de la poblacin, es desfavorable y no ventajosa como hemos indicado.
Sin embargo, conviene tener presente:
- En primer lugar, que el error por muestreo suele ser mucho menos importante que
los errores debidos al observador, al mtodo de observacin y a los individuos
estudiados, y -en segundo lugar, que el error por muestreo puede medirse
estadsticamente y en cierto modo, puede disminuirse a voluntad, tan solo con
aumentar el tamao de la muestra.
1.11.3 USOS DEL MUESTREO
El Muestreo es utilizado en diversos campos:
a. Poltica: Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
b. Educacin: Las muestras de las calificaciones de los exmenes de estudiantes se
usan para determinar la eficiencia de una tcnica o programa de enseanza.
c. Industria: La muestras de los productos de una lnea de ensamble sirve para
controlar la calidad.
d. Medicina: Las muestras de medidas de azcar en la sangre de pacientes diabticos
prueban la eficacia de una tcnica o de un frmaco nuevo.
e. Agricultura: Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
f. Gobierno: Una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
1.11.4 TABLA DE NMEROS ALEATORIOS
Las Tablas de Nmeros Aleatorios contienen los dgitos 0, 1, 2,..., 7, 8, 9. Tales
dgitos se pueden leer individualmente o en grupos y en cualquier orden, en columnas
hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible
considerarlos como aleatorios.
Las tablas se caracterizan por dos cosas que las hacen particularmente tiles para
el muestreo al azar. Una caracterstica es que los dgitos estn ordenados de tal manera
que la probabilidad de que aparezca cualquiera en un punto dado de una secuencia es
igual a la probabilidad de que ocurra cualquier otro. La otra es que las combinaciones
de dgitos tienen la misma probabilidad de ocurrir que las otras combinaciones de un
UCV Lima este
Pgina 98
Mtodos estadsticos
nmero igual de dgitos. Estas dos condiciones satisfacen los requisitos necesarios para
el muestreo aleatorio, establecidos anteriormente
Existen mtodos ms eficaces para generar nmeros aleatorios, en muchos de
los cuales se utilizan calculadoras u otra clase de aparatos electrnicos. Las tablas
elaboradas mediante estos mtodos son verificadas completamente para asegurarse de
que en realidad sean aleatorias. Sin embargo, el inters no radica en elaborar estas
tablas, sino utilizarlas.
Para utilizar una Tabla de Nmeros Aleatorios:
Hacer una lista de los elementos de la poblacin.
Numerar consecutivamente los elementos de la lista, empezando con el cero
Tomar los nmeros de una Tabla de Nmeros Aleatorios, de manera que la cantidad
de dgitos de cada uno sea igual a la del ltimo elemento numerado de su lista. De
ese modo, si el ltimo nmero fue 18, 56 72, se deber tomar un nmero de dos
dgitos.
Omitir cualquier nmero que no corresponda con los nmeros de la lista o que
repita cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el
nmero de observaciones deseado.
Utilizar dichos nmeros aleatorios para identificar los elementos de la lista que se
habrn de incluir en la muestra.
Donald B. Owen, Handbook of Statistical Tables, Reading
Mass:Addisson-Wesley, 1.962
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9002
0772 2160 7236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6466 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
0092 1629 0377 3590 2209 4839 6332 1490 3092
0935 5565 2315 8030 7651 5189 0075 9353 1921
UCV Lima este
Pgina 99
Mtodos estadsticos
NZ 2 P(1 P)
( N 1) E 2 Z 2 P(1 P)
NZ 2
( N 1) E 2 Z 2
PARA LA PROPORCIN
PARA LA MEDIA
Pgina 100
Mtodos estadsticos
Pgina 101
Mtodos estadsticos
DATOS:
ESTRATO
Ni
560
190
250
a.4 Muestreo aleatorio por rea o conglomerado: Requiere de elegir una muestra
aleatoria simple de unidades heterogneas entre s de la poblacin llamadas
conglomerados. Cada elemento de la poblacin pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente
heterogneos o dismiles. Ejemplo:
En el muestreo por conglomerados, stos se forman para representar, tan
fielmente como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria
simple de conglomerados para estudiarla. Los estudios de instituciones sociales como
iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el
muestreo por conglomerados.
Ejemplo
Para un estudio que se realiza en un AA.HH el cual est formado por 20 manzanas
escoger una muestra mediante muestreo aleatorio simple.
NMERO
MANZANA
NMERO
DE LOTE
NMERO
MANZANA
NMERO
DE LOTE
NMERO
MANZANA
NMERO
DE LOTE
NMERO
MANZANA
NMERO
DE LOTE
20
10
11
25
16
20
25
25
12
20
17
20
30
20
13
30
18
25
10
30
14
10
19
30
15
10
40
15
15
20
10
Pgina 102
Mtodos estadsticos
b.2 Muestreo por cuotas.- Se aplica en la ltima fase del muestreo, y consiste en
facilitar al entrevistador el perfil de las personas que tiene que entrevistar dejando su
criterio, la eleccin de las mismas, siempre y cuando cumplan con el perfil.
b.3 Muestreo intencionado.- Se basa en una buena estrategia y el buen juicio del
investigador. Se puede elegir las unidades del muestreo. Un caso frecuente es tomar
elementos que se juzgan tpicos o representativos de la poblacin, y suponer que los
errores en la seleccin se compensarn unos con otros. El problema que plantea es que
sin una comprobacin de otro tipo, no es posible saber si los casos tpicos lo son en
realidad, y tampoco se conoce como afecta a esos casos tpicos los posibles cambios
que se producen.
Pgina 103
Mtodos estadsticos
PROBLEMAS PROPUESTOS
1. Una cantidad, con frecuencia, de inters para una clnica es el porcentaje de
pacientes retrasados para su vacunacin. Algunas clnicas examinan cada registro
para determinar el porcentaje; Sin embargo, en una clnica grande, la realizacin
de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realiz una
muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland
para estimar la proporcin de inters. Qu tamao de muestra sera necesario con
una muestra aleatoria simple (sin reemplazo) para estimar la proporcin con el
95% de confianza y un margen de error de 0.10.
2. En un estudio, se desea determinar en qu proporcin los nios de una regin
toman incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos
tener una precisin del 10 por ciento, con un nivel de significancia del 5%. De
qu tamao debe de ser la muestra?
3. En un lote de frascos para medicina, con una poblacin de 8000 unidades, se
desea estimar la media de la capacidad en centmetros cbicos de los mismos. A
travs de un pre muestreo de tamao 35 se ha estimado que la desviacin
estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3,
y un nivel de significancia del 5%. De qu tamao debe de ser la muestra?
4. Existe tres colegios de los cuales se quiere extraer una muestra, los colegio
estas categorizado segn estrato socio econmico; del colegia A tiene 520
alumnos, el colegio B tiene 450 alumnos y el colegio C tiene 950 alumnos;
determinar cuntos alumnos de cada colegio se tiene que escoger
5. La captura de eglefino de un barco de arrastre se desembarca en Aberdeen
dividida en cuatro categoras de tamaos, que sern los cuatro estratos (datos
tomados de Pope, 1956). Se hicieron muestras de cada categora, y los resultados
se pueden resumir del modo siguiente:
Categora
Ni
Pequeo
2 432
Pequeo-Mediano
1 656
Mediano
2 268
Grande
665
TOTAL
7 021
Pgina 104
Mtodos estadsticos
Responda en
i)
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
____________________________________________________________
ii)
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________
iii)
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________
iv)
8. El censo del 2007 se muestra que en Jauja el 11.5% de los residentes tienen ms de
60 aos. Para verificar un sistema de muestreo por telfono se llaman a 200
residencias elegidas al azar. De los residentes contactados, 10.2% tenan ms de 60
aos.
a) 11.5% es un parmetro o una estadstica?
b) 10.2% es un parmetro o una estadstica?
Pgina 105
Mtodos estadsticos
Pregrado
Postgrado
Total
Hombres
2848
77
2925
Total
5309
144
5453
Mujeres
Hombres
Giovanna Santos
Carolina Soto
Jorge Molina
Gianina Ramos
Maura Rivera
Nelson Pachas
Brbara Ascue
Mara Sobarzo
Leandro Martnez
Pam Lozano
Rosa Daz
Joel Mauri
Jimena Pereira
Daro Jurez
La Gutirrez
Dany Bellido
Pgina 106
Mtodos estadsticos
Nombre
Nmero de
horas
Nombre
Nmero de
horas
Juan
2,3
Mara
2,9
Alicia
1,9
Fernanda
0,7
Pedro
2,0
Julio
0,8
Marcos
1,5
Rosa
1,0
Alberto
1,7
Fabin
1,3
Jorge
2,2
Ana
2,8
Jos
1,8
Laura
0,8
Carlos
1,9
Enrique
0,9
Miguel
1,9
Carmen
1,1
Victoria
1,6
Marcelo
1,2
Pgina 107
Mtodos estadsticos
Pgina 108
Mtodos estadsticos
ESTIMACIN DE PARMETRO
1. INTRODUCCIN
Al realizar una investigacin estadstica a
menudo se sabe o se supone que la poblacin
definida por una variable aleatoria x, de la cual se
selecciona una muestra aleatoria, tiene una forma
funcional especifica cuyo parmetro se intenta
determinar.
Los
mtodo
de
inferencia
estadstica,
bsicamente, consisten en seleccionar una muestra
aleatoria de la poblacin en estudio y con la informacin que se obtenga de esta
llegar a estimar el o los valores del parmetro desconocido.
El mtodo de estimacin de parmetro puede ser puntual o por intervalos, en el
primer caso, la estimacin del parmetro es un numero. Mientras que en el
segundo caso la estimaron del parmetro es un intervalo de los posible valores
que puede tener.
2. ESTIMACIN PUNTUAL
La estimacin puntual es el valor numrico de un estimador, un buen
estimador es aquel que se acerca al verdadero valor del parmetro.
Ejemplo: De una poblacin de 120 sueldos de Profesores de la Universidad X, se toma
una muestra de 40 sueldos, y se calcula el sueldo promedio. Supongamos que el
sueldo promedio es: S/. 690.00 soles, y al momento de concluir el trabajo podemos
decir, que el sueldo promedio de los profesores de la universidad X, tienen un sueldo
promedio de S/. 690.00. Quiere decir que el promedio poblacional , se ha estimado
puntualmente por x = S/. 690.00 soles.
3. INTERVALO DE CONFIANZA
La estimacin por intervalo es la estimacin del parmetro dentro de un
intervalo de extremo cerrado [a, b], donde los nmeros a y b se obtiene a partir
de la distribucin de la estadstica que estima puntualmente el parmetro y a
partir de los valores de la muestra.
Sea X1, X2..Xn una muestra aleatoria de tamao n escogida de una poblacin f(x,
), cuyo valores experimentales respectivos son x1, x2..xn , sea adems, la
__
expresin
H(X , X
1
2 ,...X n )
Mtodos estadsticos
Pero tambin,
X-
X 1-/2
X t (n - 1;1- /2)
s
n
Pgina 110
Mtodos estadsticos
El error de estimacin
despejando:
Error de estimacin de =
- X 1-/2
Ejemplo:
Se encuentra que en una dieta la concentracin promedio de vitaminas a partir de una
muestra de 36 mediciones en sitios diferentes del hospital es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la concentracin de vitaminas es 0.3.
a) Seale la estimacin puntual para .
b) Encuentre el intervalo de confianza al 95% para la concentracin
media de vitaminas en las dietas de dicho hospital.
c) Halle el error de estimacin de para la pregunta b.
d) Encuentre el intervalo de confianza al 99% para la concentracin media
de vitaminas en las dietas de dicho hospital.
e) Halle el error de estimacin de para la pregunta d.
Solucin:
a) La estimacin puntual para es:
X
, es decir = 2.6 gr/ml
b) IC para la media poblacional se calcula:
X 1- /2
Reemplazando valores:
c) El error de estimacin de para la pregunta b.
d) Calculando el Intervalo de confianza para la media a un nivel de confianza
del 99%
e) Calcule el error de estimacin de
Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra
de 32 focos tiene una duracin promedio de 780 horas, encuentre un intervalo de
confianza de 96% para la media de la poblacin de todos los focos que produce esta
empresa as tambin halle el error de estimacin.
Solucin:
X 1- /2
Pgina 111
Mtodos estadsticos
Ejemplo
Una muestra aleatoria de 100 hogares de una ciudad, revela que el promedio de los
ingresos mensuales es de 500 dlares. Obtenga un intervalo de confianza del 95%
para la media de la poblacin de los ingresos de todos los hogares de esa ciudad.
Asuma que la desviacin estndar poblacional es 100.
Ejemplo
Para confirmar el peso neto promedio de los frascos de conserva de palmito de la
empresa agroindustrial LA PALMA de Iquitos, cuya especificacin es de 250
gramos, un estudiante de estadstica aplicada selecciono una muestra de tamao 10
de tales frascos y observo los siguiente peso netos en gramos: 250
251 249
248 256 252 248 256 256 254
Construya un intervalo de confianza del 96%
Ejemplo
Una muestra de 60 nias de diez aos de edad proporciono un peso medio
de 40 Kg. y una desviacin estndar de 4 Kg., respectivamente. Suponiendo
que existe normalidad, encuentre los intervalos de confianza del 95% para la
media poblacional
P p
pq
n
P p 1 / 2
pq
n
Error de estimacin de P
P p= 1 / 2
pq
n
Ejemplo
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de
discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms
UCV Lima este
Pgina 112
Mtodos estadsticos
LI
(n 1) s 2
1 ; n 1
2
LS
(n 1) s 2
2
; n 1
Ejemplo
Para estimar la variabilidad de los contenidos de un producto que una empresa
comercializa en bolsa de 150 gramos. Un analista de mtodos cuantitativos
escogi una muestra aleatoria de 10 unidades del producto resultando los
siguiente pesos en gramos:
150,5 150.7 148.1 150.4 149.3 151.2 150.9 149.2 150.3 149.3
Obtenga el intervalo de confianza del 95% para la varianza de los contenidos de
todas las unidades del producto en mencin. Supngase que la poblacin de estos
contenidos se distribuye segn el modelo de la probabilidad normal.
UCV Lima este
Pgina 113
Mtodos estadsticos
PROBLEMAS PROPUESTOS
Pgina 114
Mtodos estadsticos
Pgina 115
Mtodos estadsticos
PRUEBA DE HIPTESIS
1. INTRODUCCIN
El objetivo de este tema es exponer los
mtodos estadstico bsicos que se aplican para
tomar decisiones sobre la conjetura que se hace
acerca del valor numrico del parmetro de una
poblacin en estudio
y
que es sometida
a
comprobacin experimental con el propsito de
determinar
si los
resultados
de una muestra
aleatoria extrada de esa poblacin contradicen o
no en forma significativa tal afirmacin.
2. HIPTESIS ESTADSTICA
Se denomina hiptesis estadstica a cualquier afirmacin o conjetura que
se hace acerca de la distribucin de una o ms poblaciones.
La afirmacin o conjetura se puede referirse bien a la forma o tipo de
distribucin de probabilidad de la poblacin o bien referirse al valor o valores
de uno o ms parmetro de la distribucin conocida su forma.
La hiptesis estadstica consiste en suponer que los parmetros, que define
a la poblacin, toma determinado valores numricos.
3. HIPTESIS NULA Y ALTERNATIVA
Se denomina hiptesis nula y se representa por H0 a la hiptesis que es
aceptada provisionalmente como verdadera y cuya validez ser sometida a
comprobacin experimental. Toda hiptesis nula va acompaada de una
Pgina 116
Mtodos estadsticos
Es la regin que contiene los valores para los cuales se rechaza la hiptesis
7. REGIN DE ACEPTACIN
nula.
Es la regin que contiene los valores para los cuales no se rechaza la hiptesis
8. DECISIN
Si el valor del estadgrafo cae dentro de la regin de rechazo entonces
se rechaza la hiptesis nula.
9. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPTESIS
El procedimiento que se recomienda utilizar para pruebas de hiptesis con
parmetro se resume en los siguientes pasos:
Paso 1: Formular la hiptesis nula H0 y la hiptesis alternativa H1 apropiada
H0: = 0
H1: < 0
Pgina 117
Mtodos estadsticos
Fijar , donde
Fijar , donde
Fijar , donde
Ejemplo 1
Un proceso automtico llena latas de palmito. Si el peso medio de las latas llenas es
400 gramos se afirma que el proceso est controlado, en caso contrario, el proceso no
est controlado. En el proceso de enlatado se ha determinado que los pesos de las
latas llenas tienen una desviacin estndar de 20 gramos. Si una muestra aleatoria de
100 latas llenas de palmito ha dado el peso medio de 395 gramos, se podra concluir
que el proceso est fuera de control al nivel de significacin 5%?
Pgina 118
Mtodos estadsticos
Solucin:
Sea : peso de las latas llenas de palmito
1.
Hiptesis:
(El proceso est controlado)
(El proceso est fuera de control)
2.
3.
Estadgrafo:
4.
5.
Ejemplo 2
Al estudiar si conviene o no una sucursal en la ciudad de Ucayali, la gerencia de una
tienda comercial de Lima, establece el siguiente criterio para tomar una decisin: abrir
la sucursal slo si el ingreso promedio familiar mensual en dicha ciudad es no menos
de $500 y no abrirla en caso contrario. Si una muestra aleatoria de 100 ingresos
familiares de esa ciudad ha dado una media de $480. Cul es la decisin a tomar al
nivel de significacin del 5%?
Solucin:
Sea : ingresos familiares mensuales de los pobladores de Tarapoto.
1.
Hiptesis:
(Se abre la sucursal)
(No se abre la sucursal)
2.
Pgina 119
Mtodos estadsticos
3.
Estadgrafo:
4.
5.
Ejemplo 3
Ante un reclamo sobre el tiempo de realizacin de una tarea, los empleados de una
compaa sostienen que en promedio ellos completan la tarea en a lo ms 13 minutos.
Si usted es el gerente de la compaa, qu conclusin obtiene si para una muestra de
400 tareas se obtiene un promedio de tiempo de finalizacin de 14 minutos? Se sabe,
por informacin de trabajos similares, que los tiempos de ejecucin de la tarea tiene
una distribucin normal con desviacin estndar de 10 minutos. Usar el nivel de
significancia
.
Solucin:
Sea : tiempo de realizacin de una tarea
1.
Hiptesis:
compaa)
compaa)
2.
Pgina 120
Mtodos estadsticos
3.
Estadgrafo:
4.
5.
Fijar , donde
Fijar , donde
<
Fijar , donde
si
si
Ejemplo 1
En una muestra de 19 adolescentes que sirvieron de sujetos en estudio
inmunolgico, una variable de inters fue el dimetro de reaccin de la piel a
una prueba con un antgeno. La media muestral y la desviacin estndar fue
respectivamente, 21 y 11 mm de eritema. Puede concluirse a partir de estos
datos que la media de la poblacin es 30?
UCV Lima este
Pgina 121
Mtodos estadsticos
Solucin:
Sea : dimetro de reaccin de la piel a una prueba
1.
Hiptesis:
(El dimetro de la reaccin de la piel es igual a 30 mm)
(El dimetro de la reaccin de la piel es diferente a 30 mm)
2.
3.
Estadgrafo:
4.
5.
Ejemplo 2
Una muestra de 35 estudiantes de primer ao tuvo una calificacin media de
77 en una prueba efectuada para medir su actitud . La desviacin estndar
de la muestra fue de 10. Proporcionan estos datos evidencia suficiente como
para indicar, a un nivel de significacin 0.01 que la media de la poblacin es
menor que 80?
Solucin:
Sea : Puntaje obtenidos en la prueba de actitud
1.
Hiptesis:
(Puntaje obtenido en la prueba igual a 80)
(Puntaje obtenido en la prueba menor a 80)
Pgina 122
Mtodos estadsticos
2.
3.
Estadgrafo
4.
5.
Ejemplo 3
Un distribuidor de cosmticos ha conseguido cobrar sus cuentas pendientes en un
plazo medio de 22 das, durante el ao pasado. Este promedio se considera un
estndar para medir la eficiencia del departamento de crdito y cobranzas. Sin
embargo, durante el mes en curso, un chequeo aleatorio de 81 cuentas dio como
resultado un promedio de 24 das, con una desviacin estndar de 9 das. Es este
resultado significativamente diferente del estndar al nivel del 3%?
Solucin:
Sea : Cobro de cuentas
1.
Hiptesis:
(El cobro de cuentas se realiza en tiempo estndar)
(El cobro de cuentas no se realiza en tiempo estndar)
2.
3.
Estadgrafo:
Pgina 123
Mtodos estadsticos
4.
5.
Fijar , donde
Fijar , donde
Ejemplo 1
Un mdico afirma que cierto medicamento que se prescribe para aliviar determinada
enfermedad es efectivo al 78%. Con el fin de evaluar esta afirmacin se tom una
muestra aleatoria de 400 pacientes y se encontr que 300 de ellos han experimentado
alivio. Es sta, suficiente evidencia para concluir que realmente el medicamento no es
efectivo al 78%? Utilice el nivel de significacin del 1%.
Solucin:
1.
2.
3.
Estadgrafo:
Pgina 124
Mtodos estadsticos
4.
5.
Ejemplo 2
Se afirma que cierto programa de mejoramiento gentico en alpacas de raza Huacaya
es efectivo en ms del 60%. Al parecer esta afirmacin es exagerada por lo que decide
evaluar esta afirmacin, tomando una muestra aleatoria de 200 alpacas resultando
que 173 alpacas mejoraron genticamente. Es sta suficiente evidencia para concluir
que realmente el programa de mejoramiento gentico es efectivo en ms del 60% de
los casos al nivel de significancia del 5%?
Solucin:
Sea : Efectividad de mejoramiento gentico en alpacas
1.
Hiptesis:
2.
3.
Estadgrafo:
4.
Regin Crtica:
Primero se encuentra el valor crtico que es:
y luego la regin crtica es:
Pgina 125
Mtodos estadsticos
5.
Ejemplo 3
El consumidor de un cierto tipo de producto acus al fabricante diciendo que ms del
20% de las unidades que fabrica son defectuosas. Para confirmar su acusacin, el
consumidor us una muestra aleatoria de tamao 50, donde el 27% de las unidades
eran defectuosas. Qu conclusin puede extraer usted? Use
Solucin:
1.
Hiptesis:
3.
Estadgrafo:
4.
Regin Crtica:
Primero se encuentra el valor crtico que es:
y luego la regin crtica es:
5.
Pgina 126
Mtodos estadsticos
Fijar , donde
Fijar , donde
Fijar , donde
Ejemplo 1
En un proceso de fabricacin, se plantea la hiptesis que la desviacin estndar de las
longitudes de cierto tipo de tornillo es 2 mm. En una muestra de de diez tornillo
elegidos al azar del proceso de produccin se obtuvo una desviacin estndar de 2.60
mm. Con estos datos se justifica la suposicin que la desviacin estndar verdadera es
2 mm? Use
y suponga que la distribucin de las longitudes es normal.
Solucin:
1.
Hiptesis:
2.
3.
Estadgrafo:
4.
Regin Crtica:
Primero se encuentra los valores crticos que son:
,y
Pgina 127
Mtodos estadsticos
5.
Ejemplo 2
Un bilogo cree que la varianza de vida de cierto organismo al ser expuesto a cierto
agente mortal, es a lo ms 625 minutos al cuadrado. Una muestra aleatoria de 15
organismos dio una varianza de 1225. Proporcionan estos datos evidencia suficiente
como para concluir la investigacin del bilogo acerca de que la variabilidad es
incorrecta?
Solucin:
1.
Hiptesis:
(La investigacin del bilogo es correcta)
(La investigacin del bilogo no es correcta)
2.
3.
Estadgrafo:
4.
5.
Pgina 128
Mtodos estadsticos
Ejemplo 3
Una de las maneras de mantener bajo control la calidad de un producto es controlar
su varianza. Una mquina para enlatar conservas de durazno est regulada para llenar
con una desviacin estndar de 10 gr. y con una media de 500 gr Dira usted que la
mquina ha sido adecuadamente regulada en relacin a la varianza, si una muestra de
16 latas de conserva dio una varianza de 169 gr2? Use un
y el peso de cada
lata de conserva presenta una distribucin norma
Solucin:
1.
Hiptesis:
2.
3.
Estadgrafo:
4.
Regin Crtica:
Primero se encuentra los valores crticos que son:
,y
Pgina 129
Mtodos estadsticos
EJERCICIOS PROPUESTOS
1. La concentracin media de dixido de carbono en el aire en una cierta zona no es
habitualmente mayor que 355 p.p.m.v (partes por milln en volumen). Se
sospecha que esta concentracin es mayor en la capa de aire ms prxima a la
superficie. Para contrastar esta hiptesis se analiza el aire en 60 puntos elegidos
aleatoriamente a una misma altura cerca del suelo con una media muestral de 580
p.p.m.v. Suponiendo normalidad para las mediciones, proporciona estos datos
suficiente evidencia estadstica para afirmar que la concentracin media es mayor
cerca del suelo? Use
y
a.
b.
c.
d.
, se rechaza
, no se rechaza
, se rechaza
, no se rechaza
Respuesta: Clave a
2. El promedio de nicotina que tienen los cigarros de cierta marca es igual a 11mg. Se
sabe que la distribucin de la cantidad de nicotina es normal con desviacin
estndar igual a 0.5mg. El creador de un nuevo procedimiento de fabricacin
asegura que su procedimiento disminuye el promedio de 11mg. Al nivel de
significacin
, se puede decir que el nuevo procedimiento disminuye el
promedio de nicotina?
a.
b.
c.
d.
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave d
Pgina 130
Mtodos estadsticos
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave b
6. Una empresa afirma que su producto tiene una participacin del 50% del
mercado. Para tomar una decisin respecto de lo afirmado por dicha empresa se
encuesta a 48 personas consumidoras del producto y se encuentra que 18
consumen el producto fabricado por la empresa en cuestin. Cul es la decisin
que se toma con un nivel de significancia de 2.5%?
a.
b.
c.
d.
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave d
Pgina 131
Mtodos estadsticos
no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave a
9. Con el fin de poder diferenciar a las personas con una aptitud baja y personas con
una aptitud alta para desempear determinada actividad, es necesario que la
variabilidad de los resultados de una prueba que se aplica a los postulantes a dicha
actividad sea alta. La recomendacin es que la variabilidad de la prueba, medida
por la varianza, sea
. Cuando la prueba se aplico a 12 postulantes la
varianza de los resultados fue
. Se podra decir que la prueba satisface los
requerimientos? Usar
y suponer normalidad.
a.
b.
c.
d.
, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c
10. Un fabricante de mquinas de llenado de leche en bolsas, asegura que cada una
stas deposita en las bolsas un promedio de un litro con varianza igual a 0.01.
una muestra de 10 bolsas se hall la varianza muestra
. Al nivel
significacin
, probar la hiptesis
,
adems se supone que la cantidad vertida tiene distribucin normal.
de
En
de
si
Pgina 132
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 133
Mtodos estadsticos
1. INTRODUCCIN
Las pruebas de hiptesis de proporciones de
categora de variables cualitativas en tablas de
contingencia son las siguientes:
Prueba de independencia
de variable
cualitativa
Prueba de homogeneidad de muestra
Prueba de igualdad
de ms de dos proporciones
independiente.
de poblaciones
5. Regin Crtica:
Pgina 134
Mtodos estadsticos
6. Decisin: Si
, se debe rechazar
EJEMPLO 1
500 artculos se escogieron al azar de artculos producidos. Esto es independiente
segn la calidad y segn la lnea de produccin, como se indica en la tabla que sigue:
Lnea de produccin
1
2
3
40
90
70
50
60
60
60
50
20
Calidad
c1
c2
c3
Hiptesis:
2.
3.
Calidad
Lnea de produccin
1
Total
c1
c2
c3
Total
4.
Estadgrafo:
5.
6.
el valor crtico es :
Mtodos estadsticos
Mquinas
Turnos
Total
Maana
75
90
85
250
Tarde
70
85
70
225
Noche
95
85
75
255
Total
240
260
230
730
Solucin
1.
Hiptesis:
2.
3.
Pgina 136
Mtodos estadsticos
Mquinas
Turnos
A
Total
C
Maana
Tarde
Noche
Total
4.
Estadgrafo:
5.
Regin Crtica:
6.
4. PRUEBA DE HOMOGENEIDAD
Con la prueba de homogeneidad de muestra se busca determinar si dos o ms
muestra independiente proviene de una misma poblacin. Como en el mtodo
anterior, para esta prueba los datos muestrales se registran en celda de tabla de
contingencia de orden k * c.
H0: La muestra aleatoria proviene de una misma poblacin.
Pgina 137
Mtodos estadsticos
2.
3.
4.
5.
6.
Decisin: Si
, se debe rechazar
EJEMPLO 3
Se efectu un estudio en tres colegios de Lima para determinar las preferencias de los
alumnos por tres tipos de deportes. Una muestra de 500 alumnos ha hado los
resultados de la tabla que sigue. A partir de estos datos, determine si los tres son
homogneos con respecto a sus preferencias en los tres deportes. Utilice
.
Deportes
Colegios
Total
Futbol
80
70
100
250
90
90
60
30
180
20
30
20
20
70
Total
200
150
150
500
Solucin
1.
Hiptesis:
2.
3.
Pgina 138
Mtodos estadsticos
Turnos
Mquinas
A
Total
Maana
Tarde
Noche
Total
4.
Estadgrafo:
5.
Regin Crtica:
6.
el valor crtico es :
EJEMPLO 4
Un investigador estudia el nivel de efectividad de tres remedios para aliviar cierta
enfermedad. Para esto escogi tres muestra aleatoria de tamao 50, 70 y 60 de
paciente de cierta enfermedad suministrando a la primera el remedio uno, al
segundo el remedio dos y al tercero el remedio tres y midiendo la efectividad de
los remedios en tres niveles: sin alivio, cierto alivio y alivio total. Los resultados del
experimento se dan en la tabla que sigue:
Efectividad
sin alivio
10
20
15
cierto alivio
30
20
20
alivio total
10
30
25
igual a
0.01
Pgina 139
Mtodos estadsticos
Solucin
1. Hiptesis:
2.
3.
Efectividad
Sin alivio
Cierto alivio
Total
Alivio total
Total
4.
Estadgrafo:
5.
6.
el valor crtico es :
Pgina 140
Mtodos estadsticos
PRACTICA DIRIGIDA
1. Una muestra de empleados de la universidad clasificada como docentes, no
docentes y de servicio, se les pidi que escogiera entre planes de seguro
familiar particular, en el cuadro que sigue se dan los resultados:
Plan de seguro
Clase
Docente
100
150
60
No
docente
40
70
20
Servicios
20
40
10
Presentacin
M2
M3
P1
200
130
70
P2
60
60
80
P3
40
60
100
Pgina 141
Mtodos estadsticos
Total
Remuneracin
Bajo
11
14
38
Medio
12
33
Alto
10
29
Total
26
26
24
24
100
a.
b.
c.
d.
Respuesta: Clave d
, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0
0 10
11 14
15 20
0 10
70
40
15
125
11 14
30
130
25
185
15 20
15
60
50
125
Total
115
230
90
435
a.
b.
c.
d.
Respuesta: Clave d
UCV Lima este
Notas Estadstica I
Total
, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0
Pgina 142
Mtodos estadsticos
Nivel
educativo
Prensa
Radio
TV
Primaria
15
10
25
50
Secundaria
40
25
45
110
Superior
45
30
55
130
Total
100
65
125
Total
290
, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0
6. Dos investigadores toman muestras de una misma ciudad con el objeto de estimar
el nmero de personas que corresponden a los grupos de renta de clase pobre,
media y alta (los lmites de los grupos se expresan en cantidad de dinero y son los
mismos para los dos investigadores). Los resultados que se obtuvieron fueron:
Investigador
Rentas
Total
Pobre
Media
Alta
150
100
20
270
150
80
30
260
Total
300
180
50
530
Presentan estos datos suficiente evidencia para decir que las muestras de uno de
los investigadores es sospechosa? Use nivel de significancia al 5%?
a.
, no se rechaza H0
b.
, se rechaza H0
c.
, no se rechaza H0
d.
, se rechaza H0
Respuesta: Clave c
UCV Lima este
Pgina 143
Mtodos estadsticos
7. Se realiz una encuesta entre los votantes de 4 distritos de Lima para comparar las
proporciones de votantes a favor del candidato A para la alcalda de Lima. Se
tom una muestra de 300 votantes cada uno de los 4 distritos, obtenindose los
siguientes resultados:
Votos
Lince
Distritos
Brea
Cercado
Comas
Total
A favor de A
126
103
109
98
436
En contra de A
174
197
191
202
764
Total
300
300
300
300
1200
Presentan los datos suficiente evidencia que indique que las proporciones de
votantes que estn a favor del candidato A en los 4 distritos, son diferentes? Use
nivel de significancia al 5%
a.
b.
c.
d.
Respuesta: Clave b
, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0
8. Una hacienda que siembra manzanas est interesada en determinar si dos tipos de
fertilizantes producen los mismos efectos en la produccin de manzanas. Con tal
fin las manzanas son abonadas con dos marcas distintas de fertilizantes F1 y F2. El
resultado fue que unas manzanas aumentaron su produccin, otras las
disminuyeron y otras no variaron, estos resultados se presentan en la siguiente
tabla:
F1
F2
Total
Produccin
Total
200
350
550
200
150
350
100
100
200
500
600
1100
Presentan los datos suficiente evidencia que indique que los dos tipos de
fertilizantes producen los mismos efectos? Use nivel de significancia al 5%
a.
b.
c.
d.
Respuesta: Clave a
UCV Lima este
, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0
Pgina 144
Mtodos estadsticos
9. El gerente de venta de una empresa afirma que las ventas de cuatros de sus
principales producto es homognea entre sus clientes clasificados por tipos de
ocupacin. Si su afirmacin est sustentada entre otras cosas en la muestra
aleatoria de las ventas a mil clientes tabulada como sigue:
Ocupacin
Producto
2
3
Profesionales
30
35
55
40
Comerciantes
155
50
125
80
Obreros
130
30
105
50
Ama de casa
35
15
20
45
, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0
10. Una muestra de televidentes clasificados por clase social y por la sintona
diaria de cuatro programa TV del medioda se da en la siguiente tabla:
Programa
Clase social
Pobre
Media baja
Media
Alta
190
280
500
280
250
300
350
150
3
4
160
100
250
150
180
80
120
80
, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0
Pgina 145
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CORDVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 146
Mtodos estadsticos
ANLISIS DE VARIANZA
1. INTRODUCCIN
El anlisis de varianza para experimentos diseado, es una tcnica estadstica
que se aplica para comprobar si son iguales las medias de ms de dos poblaciones
independiente mediante la comparacin de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja con muestras
adecuadamente la recoleccin de datos.
pequeas;
UN
SOLO
FACTOR
DISEO
TOTAL
5
TOTAL
MUESTRA
MEDIA
VARIANZA
Pgina 147
Mtodos estadsticos
son iguales
ESTADSTICA DE PRUEBA
Sumas cuadradas
SCT = suma del cuadrado total
SCT X ij2
X ..2
n
X
SCTR
ni .
2
i.
X ..2
Medias cuadrticas
MCT
SCT
n 1
MCTR
SCTR
k 1
MCE
SCE
nk
Pgina 148
Mtodos estadsticos
La estadstica de prueba
MCTR
MCE
F (K 1; n k)
Suma de Grados de
Cuadrados Libertad
Cuadrados
Medios
Tratamientos
SCTR
k-1
CMTR
Residual
SCE
n-k
CME
Global
SCT
n-1
Razn F
calculada
EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 mquinas de marcas diferentes
para su uso en una produccin especifica. Por esto, utilizo cada mquina al azar
para procesar cinco unidades del producto registrando los tiempo por unidad, en
segundos, resultando as el experimento completamente aleatorio. Los datos
observados son los siguientes:
M1:
M2:
M3:
M4:
55
60
64
42
46
58
62
45
45
68
51
52
73
58
57
44
50
63
65
42
Con un nivel de significancia del 5% pruebe la hiptesis que las mquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2
Cuatro profesores cada uno con un grupo de alumnos, ensean el mismo curso de
estadstica, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:
P1:
P2:
P3:
P4:
12
14
13
10
11
16
12
14
09
13
08
17
17
18
11
14
12
17
12
15
Pgina 149
Mtodos estadsticos
EJERCICIOS PROPUESTOS
55
52
53
52
53
58
55
50
60
50
57
51
52
60
51
49
53
52
54
53
diferencia
2. Para comparar el tiempo empleado en realizar una tarea especfica bajo tres
procedimientos un investigador diseo un experimento seleccionando al azar
tres muestra independiente de 10 operarios cada una y asigno al azar un
procedimiento a cada muestra. Los tiempos registrado en segundo son los
siguientes:
P1
P2
P2
13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07 13.65 18.79
22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08 18.35 17.22
18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44 18.47 25.42
55
63
48
59
53
67
50
68
50
55
59
57
60
62
50
66
55
70
47
71
65
75
61
73
Indica estos datos que las marcas de los neumticos producen efectos
significativo en el rendimiento?
UCV Lima este
Pgina 150
Mtodos estadsticos
710
610
560
500
560
560
610
400
490
490
470
500
550
550
510
550
568
610
580
520
35
43
28
39
33
47
30
48
30
35
39
37
40
45
30
46
Pgina 151
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 152
Mtodos estadsticos
2. DIAGRAMA DE DISPERSIN
Se denomina diagrama de dispersin o nube de puntos, a la grfica de
los valores (x,y) de las variables X e Y en el sistema cartesiano.
Es frecuente visualizar el tipo de relacin existente entre dos variables a partir
del diagrama de dispersin.
Pgina 153
Mtodos estadsticos
3. LA COVARIANZA
La covarianza de los datos observado en una muestra es la estadstica que
mide el nivel de la variabilidad conjunta de los datos de las variables en pareja
con respecto a sus medias respectivas.
4. EL COEFICIENTE DE CORRELACIN
El coeficiente de correlacin lineal de Pearson de los n pares de valores de
una variable bidimensional (x,y) es el numero abstracto o relativo r que se calcula
por:
cov( x, y )
SS
x
Donde:
Cov(x,y) es la covarianza de x e y.
es la desviacin estndar de x.
es la desviacin estndar de y.
El coeficiente de correlacin de la muestra es un nmero real comprendido
entre -1 y 1. El grado o nivel de ajuste de la ecuacin a los datos se analiza en
forma descriptiva aplicando el coeficiente de determinacin que se define como
el cuadrado del coeficiente de correlacin.
Interpretacin:
Pgina 154
Mtodos estadsticos
Que mejor se ajusta a los valores de la muestra, con el fin de poder predecir
o estimar Y a partir de X.
El proceso de predecir o estimar Y a partir de la variables X , es la regresin.
Hallar la funcin lineal, consiste en determinar las constante a y b a
partir de los datos de la muestra, para lo cual se usara el mtodo de mnimos
cuadrados.
cov( x, y )
x2
__
__
a y b x
6. COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin es una medida de la proximidad del ajuste
de la recta de regresin. Cuanto mayor sea el valor, mejor ser el ajuste y ms til
la recta de regresin como instrumento de prediccin; para calcular el coeficiente
de determinacin se eleva al cuadrado el coeficiente de correlacin. El nmero r2 es
denominado coeficiente de determinacin.
Pgina 155
Mtodos estadsticos
s2
2
SCE y a y b xy
n2
n2
Varianza estimada de b:
S b2
___ 2
S XX X n X
2
s
s xx
Pgina 156
Mtodos estadsticos
; n 2)
b
sb
ANLISIS DE VARIANZA
El mtodo del ANOVA de la regresin lineal simple plantea la hiptesis nula
si b es igual a cero:
___ 2
SCT y 2 n y
SCR b( xy n x y )
CMR SCR
CME
Valor de la tabla
F (1, n 2,1 )
__ ___
SCE
n2
CMR
CME
Pgina 157
Mtodos estadsticos
que
Y:FINAL
14
08
11
06
12
15
19
10
12
15
Pgina 158
Mtodos estadsticos
n XY ( X )( Y )
n Y
( Y ) 2 n X 2 ( X ) 2
= 0.7555
n XY ( X )( Y )
n X 2 ( X ) 2
A Y bX
Y = 3.38 + 0.75 X
Pgina 159
Mtodos estadsticos
Modelo
Coeficientes
tipificados
Error tp.
Beta
(Constante)
3,377
2,828
X_PARCIAL
,754
,231
,756
P_VALOR
1,194
0,267
3,262
0,011
Modelo
1
R
cuadrado
,756
,571
2,616
Dado que el r = 0.756 se dice que existe relacin lineal positiva entre las notas
del examen parcial y el examen final.
Suma de
cuadrados
gl
Media
cuadrtica
P_VAL
OR
Regresin
72,846
72,846
10,643
,011
Residual
54,754
6,844
Total
127,600
Pgina 160
Mtodos estadsticos
EJERCICIOS PROPUESTOS
1) En un estudio del efecto de un componente de la dieta sobre la
composicin de los lpidos del plasma, se obtuvieron los siguientes datos en
una muestra de 8 animales experimentales
X = Medida del componente de la dieta
Y = Medida de la concentracin de lpidos en el plasma
18
38
21
40
28
47
35
54
47
66
33
52
40
59
19
38
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.
Pgina 161
Mtodos estadsticos
80
0,08
280
0,38
120
0,12
320
0,41
160
0,18
360
0,42
200
0,21
400
0,51
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.
30
1,15
35
1,11
40
0,98
45
1,01
50
0,97
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
Pgina 162
Mtodos estadsticos
50
48
75
36
55
41
80
38
60
45
85
36
65
41
90
30
70
42
95
32
Hallar la covarianza
Hallar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.
105
101
102
95
104
93
100
97
97
10
88
Pgina 163
Mtodos estadsticos
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
350
100
400 450
1105 130
500
160
950
350
850
350
700
250
900
320
600
130
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
58
Ausentismo:
18
12
8
37
55
32
41
50
23
60
15
10
13
16
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
Pgina 164
Mtodos estadsticos
Gastos:
30
20
40
50
70
60
80
70
80
90
Ventas:
300 250
400
380
550
750
630
930
700
750
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
Rendimiento:
45
48
52
10
11
12
55
60
65
68
70
74
76
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
14
Calificaciones: 12
16
22
20
18
16
18
16
18 22
13
15
15
17
11
14
16
08
las
los
05
Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo
Pgina 165
Mtodos estadsticos
BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
Pgina 166