You are on page 1of 166

MDULO AUTOINSTRUCTIVO DE

APRENDIZAJE
MTODOS ESTADSTICOS

PROGRAMA DE FORMACIN GENERAL


EQUIPO DE MTODOS ESTADSTICOS
2012I

Mtodos estadsticos

NDICE

INTRODUCCIN
INSTRUCCIONES PARA EL USO DEL MANUAL
ESQUEMA GENERAL DE CONTENIDO
PRIMERA UNIDAD: Estadstica descriptiva
1. ESTADSTICA, VARIABLE Y ESCALA DE MEDICIN06
2. INVESTIGACIN ESTADSTICA, RECOLECCIN DE DATOS Y ORGANIZACIN
Y PRESENTACIN DE DATOS................................................................19
3. ORGANIZACIN Y PRESENTACIN DE DATOS CUANTITATIVOS...24
4. MEDIDAS DE TENDENCIA CENTRAL............................48
5. MEDIDAS DE DISPERSIN...61
SEGUNDA UNIDAD: Probabilidades e inferencia
6. PROBABILIDAD BSICA...69
7. DISTRIBUCIONES IMPORTANTES..81
8. TEORA DE MUESTREO...95
9. ESTIMACIN DE PARMETROS..109
TERCERA UNIDAD: Estadstica inferencial
10. PRUEBA DE HIPTESIS. 116
11. ANLISIS DE VARIANZA .. 147
12. REGRESIN LINEAL . 153

UCV Lima este

Pgina 2

Mtodos estadsticos

INTRODUCCIN
El presente mdulo ha sido concebido como un material de consulta para el
estudiante de la asignatura de Mtodos estadsticos.
El propsito de este producto es la exposicin de informacin acerca de teora
estadstica que le permita calcular indicadores que conlleven a tomar una decisin.
El desarrollo de los temas se realiz en torno a las sesiones comprendidas en el
slabo del curso, considerando de manera pertinente, un nivel de complejidad
creciente, sobr4e todo en los aspectos prcticos de cada tema.
Adems, cada captulo tiene presenta una introduccin, donde se explica, de
manera general, los objetivos del temas; luego abarca el desarrollo del contenido y
finalmente se plantean los ejemplos y problemas de aplicacin prctica resueltas.
En cuanto a la organizacin y presentacin del contenido, el mdulo se
conforma de la siguiente manera: en la sesin uno se estudian los concepto de
estadstica, variable y escala de medicin; en la sesin dos, investigacin estadstica,
recoleccin de datos y la representacin de una variable cualitativa con su respectiva
grfica; en la sesin tres, la organizacin y presentacin de datos para variable
cuantitativa; en la sesin cuatro, la medida de tendencia central; en la sesin cinco,
la medida de dispersin; en la sesin seis, la probabilidad bsica; en la sesin siete,
distribuciones importantes; en la sesin ocho, teora de muestreo; en la sesin nueve,
estimacin de parmetro; en la sesin 10, prueba de hiptesis; en la sesin 11, prueba
chi cuadrado; en la sesin 12, anlisis de varianza y en la sesin 13, anlisis de
regresin.
Finalmente, los docentes de la experiencia curricular Mtodos estadsticos
esperamos que este mdulo autoinstructivo de aprendizaje cumpla con su propsito y
sea de gran importancia y beneficio para el estudiante.

UCV Lima este

Pgina 3

Mtodos estadsticos

INSTRUCCIONES PARA EL USO


DEL TEXTO AUTOINSTRUCTIVO
Estimado estudiante:
El material que le presentamos ha sido elaborado exclusivamente para usted
considerando que es un mtodo alternativo de enseanza-aprendizaje orientado a
lograr las capacidades de esta experiencia curricular. Por ello, le solicitamos que
tenga en cuenta las siguientes sugerencias para su tratamiento:
1.

Evite su reproduccin parcial o total del texto como muestra de su respeto a


la propiedad intelectual.

2. Lea con atencin y aplique las tcnicas de procesamiento de informacin a


fin de lograr la comprensin del tema.
3. Realice las actividades como se indican.
4.

Utilice, de preferencia, lpiz para evitar borrones y trabajar con limpieza.

5. Realice todos los ejercicios propuestos, porque son importantes para su


aprendizaje.

UCV Lima este

Pgina 4

Mtodos estadsticos

ESQUEMA GENERAL DEL CONTENIDO

MTODO ESTADSTICO

ESTADSTICA
DESCRIPTIVA
ESTADSTICA,
VARIABLE Y
ESCALA DE
MEDICIN
INVESTIGACIN
ESTADSTICA,
RECOLECCIN
Y
ORGANIZACIN
Y
PRESENTACIN
DE DATOS
PRESENTACIN
DE DATOS

PROBABILIDADES
E INFERENCIA

ESTADSTICA
INFERENCIAL
APLICADA

PROBABILIDAD
BSICA

PRUEBA DE
HIPTESIS

DISTRIBUCIONES
IMPORTANTES

ANLISIS DE
VARIANZA

TEORA
DE
MUESTREO

REGRESIN
LINEAL

ESTIMACIN DE
PARMETROS

ORGANIZACIN
Y
PRESENTACIN
DE DATOS
CUANTITATIVOS
MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS DE
DISPERSIN

UCV Lima este

Pgina 5

Mtodos estadsticos

UNIDAD DIDCTICA 1: ESTADSTICA DESCRIPTIVA


Capacidad: Aplica los conceptos bsicos de la estadstica orientados a la
Investigacin.

ESTADSTICA, VARIABLE Y ESCALA DE MEDICIN


CONSIDERACIONES GENERALES
1. INTRODUCCIN
Cuando se habla de estadstica, se suele pensar
en una relacin de datos numricos presentada de
forma ordenada y sistemtica. Esta idea es la
consecuencia del concepto popular que existe sobre
el trmino y que cada vez est ms extendido debido
a la influencia de nuestro entorno, ya que en estos
das es casi imposible que cualquier medio de
difusin, peridico, radio, televisin, etc. Nos aborde diariamente con cualquier tipo
de informacin estadstica sobre accidentes de trnsito, ndices de crecimiento de
poblacin, turismo, tendencias polticas, etc.
Solo cuando entramos en un mundo ms especfico como es el campo de la
investigacin de las Ciencias Sociales (Medicina, Biologa, Psicologa) empezamos a
percibir que la Estadstica se convierte en la nica herramienta que permite obtener
resultados, y por tanto, beneficios en cualquier tipo de estudio, cuyos movimientos y
relaciones, por su variabilidad, no puedan ser abordadas desde la perspectiva de las
leyes deterministas.
Podramos, desde un punto de vista ms amplio, definir la estadstica como la
ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de
accin en situaciones prcticas.
2. ORIGEN ETIMOLGICO
Palabra griega
Palabra latn
Palabra alemn

UCV Lima este

STATERA
STATUS
STAAT

Balanza
Situacin
Estado

Pgina 6

Mtodos estadsticos

3. HISTORIA
Los orgenes de la estadstica aunque son an desconocidos y no se sabe con
exactitud cundo se comenz a utilizar, la historia refleja que su us es muy antiguo
para el conteo de combatientes, para los impuestos, defunciones, estudio de recursos
naturales, pero fueron los romanos, maestros de la organizacin poltica, quienes
mejor supieron ocupar la estadstica, cada cinco aos realizaban un censo de la
poblacin, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales
para estudiar los avances del imperio y los recuentos de ganancias y las riquezas que
dejaban las tierras. Su uso soport las funciones tradicionales del gobierno central y
del Estado, como llevar registros sobre la situacin de la poblacin: nmero de
habitantes, nmero de nacimientos, nmero de defunciones, produccin, impuestos y
otros hechos contables y de control.
Seguidamente los hechos ms saltantes:
Egipcios
Datos de Administracin Estatal
Roma
Registros tributarios Empadronamiento (Ao 0)
rabes
Censo Estadsticas sistematizadas (Edad Media)
El Clero
Recopilacin, ordenamiento y estudio de datos demogrficos
Reyes Catlicos
Censo (siglo XVI) Censo del Marqus de la Ensenada 1748
Indias de Sevilla
Estadsticas Econmicas
Imperio Incaico
Registros demogrficos y socio econmicos mediante los Quipus
Alemania
Primera ctedra de Estadstica
4. ETAPAS DE LA ESTADSTICA

Escuela Alemana. Permiti la primera ctedra de estadstica descriptiva con un


enfoque de estado o administracin.
Escuela Inglesa. Cuantific las leyes de los fenmenos sociales o polticos y
aritmticos a la Estadstica.
Escuela Francesa. Introduce la teora de las probabilidades.

5. PERSONAJES NOTABLES EN LA HISTORIA DE LA ESTADSTICA:

Quetelet, estadstico Belga, aplic estadstica a la investigacin de problemas


sociales y educativos.
Walker atribuye a Quetelet el desarrollo de la teora estadstica como mtodo de
investigacin general en todas las ciencias de la observacin.
Francis Flton, ejerci mayor influencia en la introduccin y empleo de la
estadstica en las ciencias sociales.
Pearson, matemtico, colabor con Galton en el desarrollo de frmulas de
correlacin y regresin.
James Mc Keen Cattel, profundiz la Estadstica con Galton y otros estadsticos.
Thorndike, aplic mtodos estadsticos en la psicologa y en la educacin.
R.A. Fisher, ingls que introdujo nuevas tcnicas y mtodos en el estudio de
muestras.

UCV Lima este

Pgina 7

Mtodos estadsticos

Godofredo Achenwall, fue el primer gran terico de la Estadstica en lengua


alemana y dio el nombre de Estadstica (status).
Blas Pascal, Escuela Probabilstica.
Francisco Galton y Karl Pearson, con la regresin y correlacin

6. CULTURA ESTADSTICA
Refiere a dos componentes interrelacionados:
a) Capacidad para interpretar y evaluar crticamente la informacin estadstica, los
argumentos apoyados en datos que las personas pueden encontrar en diversos
contextos, incluyendo los medios de comunicacin, pero no limitndose a ellos.
b) Capacidad para discutir o comunicar sus opiniones respecto a tales
informaciones estadsticas cuando sea relevante
7. DEFINICIN
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar,
resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa de los mismos; as como de realizar inferencias a partir
de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.
La estadstica se clasifica en estadstica descriptiva y en estadstica inferencial.
Se denomina Estadstica Descriptiva al conjunto de mtodos estadsticos
que se relacionan con el resumen y descripcin de los datos, como tablas,
grficas y el anlisis mediante algunos clculos.
Se denomina Inferencia Estadstica al conjunto de mtodos con los que
hacen la generalizaciones o la inferencia sobre una poblacin utilizando una
muestra. La inferencia puede contener conclusiones que pueden no ser ciertas
en forma absoluta, por lo que es necesario que estas sean dadas con una
medida de confiabilidad conocida como probabilidad.
8. POR QU ESTUDIAR ESTADSTICA?
La estadstica, como la matemtica, constituye uno de los idiomas
esenciales para comunicarse en el mundo universal de la ciencia y la
tecnologa. La estadstica permite comprender con mayor facilidad la
bibliografa especializada. La mayora de los libros, estudios e investigaciones
especializada en economa, educacin, sociologa, medicina, psicologa, etc.,
contienen resultados basados en el anlisis estadstico.
Sin lugar a dudas, aquellos profesionales que no conozcan estadstica tendrn
serias dificultades para ser expertos en sus respectivos campo cientfico.
UCV Lima este

Pgina 8

Mtodos estadsticos

En las diversas reas y especialidades de la formacin profesional y


cientfica, la estadstica constituye una ciencia auxiliar y complementaria, que
ofrece tcnica, mtodos, modelos y procedimientos para el anlisis cuantitativo
y cualitativo de los fenmenos y hechos que interesa estudiar a los
profesionales.
La estadstica es una herramienta auxiliar de utilidad inmediata y practica
en el trabajo profesional. Permite registrar hechos, calcular repeticiones, analizar
datos, observaciones
y calcular indicadores, as como tambin ayuda a
cuantificar o dimensionar el comportamiento de los hechos y variables en una
poblacin determinada, realizar estimaciones y proyecciones.
La estadstica ayuda a desarrollar una investigacin rigurosa, no es
simplemente un conjunto de frmulas, procedimientos y modelos. La estadstica
por la forma como est estructurada, operacionaliza los datos, ofrece
fundamentos lgicos en lo que se sustenta la investigacin bsica y aplicada,
de all que la estadstica constituye la tecnologa del mtodo cientfico.
En toda investigacin una vez formulado el problema, la tarea inmediata
es el diseo del plan de anlisis estadstico, antes de obtener los datos en las
unidades de anlisis. La estadstica participa en la solucin del problema,
puesto que permite revelar la informacin vital para la solucin de un
problema prctico. Ayuda a conocer la caracterstica de una poblacin, cuyo
resultado orienta la toma de decisiones. La estadstica permite hacer inferencia
acerca de una poblacin a partir de datos obtenido de una muestra
representativa.
9. OBJETIVO DE LA ESTADSTICA
En trminos generales los objetivos de la estadstica pueden ser
clasificados o agrupados en tres grandes grupos: descripcin, anlisis y
prediccin.

Descripcin de grandes colecciones de datos empricos; reducindolos a


un pequeo nmero de caractersticas que concentra la parte ms
importante y significativa de la informacin proporcionada por los datos.
Este proceso se conoce con la denominacin Reduccin de datos. La
descripcin supone que los datos que viene expresados en su forma natural
deben ser clasificados y presentados sistemticamente en cuadros o tablas
como una primera reduccin de datos; sin embargo, la reduccin de datos
propiamente dicha se obtiene cuando el comportamiento y caractersticas
de los datos se expresan por un conjunto de indicadores, medidas resumen
o estadgrafos.
El trabajo estadstico se inicia con el estudio del problema, la identificacin
de variables y la recoleccin de datos. Tanto la reduccin como la

UCV Lima este

Pgina 9

Mtodos estadsticos

descripcin de la informacin se estudia en el gran captulo denominado


Estadstica Descriptiva. Es importante anotar que la descripcin
estadstica de los fenmenos o hechos es el primer aspecto al cual se
redujo
la
ciencia
estadstica
durante
mucho
tiempo, aplicndose
especialmente a los datos demogrficos, sociales, econmicos, etc.

Anlisis estadstico de datos experimentales y de los fenmenos


observados. Toda investigacin estadstica incluye un problema de anlisis
de datos experimentales, con el objeto de formarse un concepto de una
poblacin o universo y adoptar decisiones. En este caso no es necesario
observar toda la poblacin si no que ser suficiente elegir una muestra
representativa. La preocupacin del anlisis estadstico es inferir propiedades
para una poblacin sobre la base de resultados mustrales conocidos. Aqu
se presentan varios problema que trata la estadstica de hoy, como aquellos
relacionados con el muestreo estadstico, la estimacin estadstica y el
clculo
de probabilidades, las pruebas estadstica,
etc. Estos aspectos
corresponden a la inferencia estadstica.

Predicciones o comportamiento de los fenmenos en el futuro, lo cual


constituye la mxima aspiracin practica de toda ciencia. Este objetivo de
prediccin y previsin est implcito tanto en la descripcin como en el
anlisis estadstico, puesto que en general interesa orientar la toma de
decisiones con vigencia y efecto en el futuro. El pasado puede ser
evaluado, el presente descrito con cierta exactitud y el futuro puede ser
previsto, la prediccin puede entenderse como la estimacin de resultados
en el futuro.

10. NOMENCLATURA ESTADSTICA


Poblacin, es el conjunto de elementos que contienen una o ms caracterstica
observable de naturaleza cualitativa o cuantitativa que se pueden medir en
ellos.
Unidad estadstica, viene hacer cada elemento de la poblacin.
Dato, es el resultado de medir una caracterstica observable de una unidad
estadstica.
Informacin, es el resultado que se obtiene al procesar un conjunto de datos.
Muestra, se denomina muestra a una parte de la poblacin seleccionada de
acuerdo con un plan o regla, con el fin de obtener informacin acerca de la
poblacin de la cual proviene.
Parmetro, se denomina parmetro a una medida descriptiva que resume una
caracterstica de la poblacin, calculada a partir de los datos observados en
toda la poblacin.
UCV Lima este

Pgina 10

Mtodos estadsticos

Estadgrafo, se denomina estadgrafo a una medida descriptiva que resume una


caracterstica de la muestra, calculada a partir de los datos observado en una
muestra aleatoria.
11. ELEMENTOS BSICOS DE LA ESTADSTICA
Despus de la conceptualizacin de estadstica y la precisin de sus
objetivos, es fcil advertir que en el trabajo estadstico existen tres elementos
bsicos como son: unidad de anlisis, las variables y los datos.

Unidades de anlisis, que pueden ser personas, instituciones, objetos, familia,


animales y otras unidades ms complejas. Estas unidades tienen una
caracterstica en comn, en cuanto constituyen el objeto de estudio de una
investigacin.
Las variables, dimensiones o caractersticas que se desea conocer en
relacin a las unidades de anlisis, tales como la edad, ingresos, consumo
de carne, lugar de nacimientos, ahorros, etc. las variables se definen e
identifican en funcin de los objetivos del estudio.
Los datos o valores que alcanzan las unidades en las variables estudiadas,
son las respuestas o resultados que se obtienen cuando las unidades de
anlisis son preguntados. Habr tantos datos como elementos tiene la
poblacin en estudio.

VARIABLE ESTADSTICA
1. DEFINICIN
Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms
valores o modalidades.
2. ELEMENTOS DE UNA VARIABLE
La identificacin y definicin de variables es la tarea ms delicada de
toda investigacin y del trabajo estadstico. Tngase presente que las variables
se deduce a partir de los objetivos de un estudio o investigacin. En
consecuencia, para tener xito en la seleccin de variables, es recomendable
distinguir los siguientes cinco elementos:
Nombre o denominacin de la variable
Definicin o conceptualizacin de la variable
Un conjunto de categora o niveles, que es definida por el investigador.
Las categora no son nica, lo mnimo es dos categoras y dependen de
los objetivos de la investigacin.
Procedimientos para categorizar o agrupar las unidades de anlisis
UCV Lima este

Pgina 11

Mtodos estadsticos

Algunas medidas de resumen o indicadores

3. CLASIFICACIN DE LA VARIABLE
3.1 VARIABLE CUALITATIVA
Cuando expresa una cualidad, caracterstica o atributo, tiene carcter
cualitativo, sus datos se expresan mediante una palabra, es no numrico, y se
clasifican en variables cualitativa nominal y variables cualitativa ordinal.
a. Variable cualitativa nominal: Es aquella variable que permite clasificar a una
unidad elemental en una sola categora.
Ejemplo 4
Lugar de nacimiento
Color de ojos
Partidos polticos
b. Variable cualitativa ordinal: Es aquella variable que permite clasificar a una
unidad elemental en una sola categora, y a la vez expresa orden de jerarqua.
Ejemplo 5
Clase social
Grado de estudio
Grado dentro del mando militar
3.2 VARIABLE CUANTITATIVA
Cuando el valor de la variable se expresa por una cantidad, es de
carcter numrico. El dato o valor puede resultar de la operacin de contar o
medir. Las variables cuantitativas pueden ser discretas o continuas.
a. Variable cuantitativa discreta: Cuando el valor de la variable resulta de la
operacin de contar, su valor est representado solo por nmeros naturales.
Ejemplo 6
Nmeros de hijo por familia
Nmero de accidentes por das
Nmero de trabajadores por empresa
Variable cuantitativa continua: Es toda variable cuyo valor se obtiene por
medicin o comparacin con una unidad o patrn de medida. Las variables
continuas pueden tener cualquier valor dentro de su rango o recorrido, por
tanto se expresa por cualquier nmero real.

UCV Lima este

Pgina 12

Mtodos estadsticos

Ejemplo 7
reas de parcelas
Ingreso monetario
Produccin de maz

ESCALA DE MEDICIN
1. INTRODUCCIN
En estadstica medir es observar el valor que toma una variable
estadstica en un elemento de la poblacin, los valores de las variables, adems de
ser cualidad o cantidad, define niveles de medicin de las unidades estadsticas, estos
niveles de medicin son denominado escalas.
2. DEFINICIN
Se denomina escala de medicin a los distinto niveles de valores que la
variable estadstica asigna a las unidades estadsticas en estudio.
3. ESCALA NOMINAL
Se dice que los valores de una variable estadstica estn en el nivel de escala
nominal si estos solo clasifican a las unidades estadstica en iguales o diferentes.
Los valores cualitativos son como etiquetas que la variables asigna a las unidades
estadstica hacindolas iguales entre s o diferentes. Si se asigna nmero a estos
valores cualitativos no es posible realizar operaciones aritmticas.
El mtodo estadstico con datos obtenidos en escala nominal consiste
bsicamente en obtener el nmero de casos en cada modalidad y obtener la
moda.
4. ESCALA ORDINAL
Se dice que los valores de una variable estadstica estn en el nivel de escala
ordinal si estn en escala nominal y si adems ordenan a las unidades estadstica
por la caracterstica que se observa.
Los valores cualitativos de una variable en escala ordinal son los resultados
de un criterio para ordenar a las unidades estadstica. Si se asignara nmeros a tales
valores, no es posible realizar operaciones aritmtica, solo son vlidas las relaciones
de igualdad, de no igualdad y de orden.

UCV Lima este

Pgina 13

Mtodos estadsticos

El mtodo estadstico con datos obtenidos en escala ordinal consiste


bsicamente en obtener el nmero de caso en cada categora, as como, obtener la
moda, la mediana y el coeficiente de correlacin de rangos.
5. ESCALA DE INTERVALOS
Una escala de intervalo es una escala ordinal que asigna a las unidades
estadstica valores numrico, que son mediciones realizadas con respecto a un cero
arbitrario, este cero no es real o absoluto, pues no mide la ausencia total de la
caracterstica que se observa en la unidad estadstica.
Con los valores de una variable en escala de intervalo se puede comparar la
diferencia de las mediciones de dos unidades estadstica con otra diferencia.
Con los valores de esta escala son validas pues, las relaciones de igualdad,
de no igualdad y de orden. Adems, son validas las operaciones de adicin y
sustraccin entre valores de escala y la multiplicacin y divisin entre la diferencia
de dos valores de la escala. Pero, no es vlida la multiplicacin y divisin entre
los valores mismos de la escala.
Si una variable estadstica tiene sus valores en escala de intervalo, entonces
permanece invariante ante la transformacin.
6. ESCALA DE RAZN
La escala de razn o cociente es una escala de intervalo que asigna a las
unidades estadstica valores numricos, que son mediciones realizadas con respecto
a un cero real. Este cero significa ausencia total de la caracterstica que se observa.
Los valores de esta escala se obtienen en general, por mediciones que son conteos o
mediciones continuas.
Adems, con los valores de una variable en escala de razn se puede
comparar cuantas veces la medida de una unidad estadstica es igual a la medida
de otra unidad estadstica.
Con los valores de la variable en escala de razn son validas las relaciones
de igualdad, de no igualdad, de orden y todas las operaciones matemticas.
Si una variable estadstica tiene sus valores en escala de razn, entonces permanece
invariante ante la transformacin.

UCV Lima este

Pgina 14

Mtodos estadsticos

ACTIVIDADES
1

Qu es la estadstica?
_______________________________________________________
_______________________________________________________
________________________________________________________________________
________________________________________________________________________

2 Qu es la inferencia estadstica?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
3

Por qu estudiar estadstica?


________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________

1 Cul es la diferencia entre un dato e informacin?


________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
5

Cmo se clasifican las variables?


________________________________________________________________________
________________________________________________________________________
________________________________________________________________________

UCV Lima este

Pgina 15

Mtodos estadsticos

GLOSARIO

Defina brevemente, con sus propias palabras, cada trmino de


la lista.

Estadstica.

Estadstica descriptiva

Estadstica inferencial.

Dato....

Variable

Variable cualitativa.

Variable cuantitativa...

Informacin..

Poblacin.

Unidad de anlisis..

Parmetro.

Muestra.

Estadgrafo...

Escala de razn...

Escala por intervalo...

UCV Lima este

Pgina 16

Mtodos estadsticos

AUTOEVALUACIN

1.

Qu escuela cuantifico las leyes del fenmeno social o


poltico y aritmtico a la estadstica?
a) Alemana
b) Inglesa
c) Francesa
d) Todas

2.

Qu matemtico colaboro con GALTON al desarrollo de la correlacin de


Pesaron?
a) Walker
c) Fisher
b) Pesaron
d) Todos

3.

Cul es la parte de la estadstica que se encarga de representar a un conjunto


de dato mediante grficos?
a) Inferencia
c) La muestra
b) El parmetro
d) La descriptiva

4.

Cul es la mxima aspiracin de toda ciencia?


a) Sumar
c) Restar
b) Multiplicar
d) Predecir

5.

Qu es una muestra?
a) Es una parte de la poblacin
b) Es toda la poblacin
c) Es un nmero
d) Es una informacin

6.

Qu es la unidad de anlisis?
a) Es dato
b) Es un valor
c) Es una informacin
d) Es la mnima unida de la poblacin

7.

Qu es informacin?
a) Es un valor que resulta despus de un proceso matemtico
b) Es una muestra
c) Es una poblacin
d) Es una variable

Solucin
1.- c

2.- b

UCV Lima este

3.- d

4.- d

5. a

6.- d

7.- a

Pgina 17

Mtodos estadsticos

BIBLIOGRAFA

1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones


R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 18

Mtodos estadsticos

INVESTIGACIN ESTADSTICA. RECOLECCIN Y ORGANIZACIN Y


PRESENTACIN DE DATOS

INVESTIGACIN ESTADSTICA

1. INTRODUCCIN
En esta sesin se estudiara las definiciones
de investigacin estadstica, as como los
procedimientos para elaborar una tabla de
frecuencia y los grficos respectivo para una
variable cualitativa sea nominal u ordinal.
2. DEFINICIN
La investigacin es un proceso de produccin de conocimiento cientficos;
es un proceso sistemtico a travs del cual se recogen datos e informacin de
la realidad objetiva para dar respuesta a las interrogantes que se plantean. No
hay investigacin grande o pequea, simplemente investigar es buscar respuesta
para plantear soluciones.
Cuando se aplica el mtodo cientfico al estudio de los problemas
econmicos se habla de investigacin econmica, asimismo se tiene investigacin
educativa, investigacin agropecuaria, etc. Toda investigacin requiere de datos,
sin datos no hay investigacin, entonces surge la necesidad de definir mtodos,
anlisis o tratamientos de datos, con el propsito de obtener algunas medidas
o indicadores que expresen la dimensin o niveles de la variable estudiada, es
decir, realizar la operacionalizacin de las variables. En este contexto la
estadstica surge como ciencia auxiliar de la investigacin, que por su naturaleza,
estructura y mtodos en este proceso, el anlisis estadstico tambin cumple con
los diversos paso de la investigacin.
3. OBJETIVO
El objetivo de la investigacin estadstica es descubrir respuestas a
determinada interrogantes a travs de la aplicacin de procedimientos cientficos.
El punto de partida de la investigacin es la existencia de un problema que
habr que definir, examinar, valorar, y analizar crticamente, para luego formular
y entender su solucin.

UCV Lima este

Pgina 19

Mtodos estadsticos

4. ETAPAS
La investigacin estadstica por su naturaleza, es fundamental de tipo
descriptiva; se preocupa de la confiabilidad, validez y significacin de los datos,
de la muestras as como los mtodos y tcnica de recoleccin y anlisis
estadstico.
La investigacin estadstica es un proceso donde se distinguen cinco etapas:
a. Planteamiento o preparacin

Fundamento y compresin del estudio e identificacin de las variables


Determinacin de objetivos
Organizacin de las variables
Precisin de los datos e informacin requerida
identificacin y evaluacin de la fuente de informacin
Identificacin y anlisis de estudios similares
Determinacin del mbito de la investigacin
Preparacin del plan para ejecutar la investigacin
Formacin y capacitacin del equipo de trabajo
Elaboracin del calendario de actividades
Formulacin del presupuesto y fuente de financiamientos

b. Recopilacin de los datos


La recopilacin o recoleccin de datos es el momento en el cual el
investigador se pone en contacto con los objetos o elementos sometidos a
estudio, con el propsito de obtener los datos o respuesta a las variables
analizadas.
El mtodo de recoleccin est asociado tambin con el tipo y naturaleza
de la fuente de datos.
c. Organizacin y presentacin de datos
Despus de la recopilacin de los datos, se procede a su organizacin,
clasificacin y tabulacin, de modo que se facilite la presentacin en tablas
cuadros o grficos.
Como tarea previa a la investigacin es indispensable realizar una
evaluacin, critica, correccin y ajuste de los datos, el propsito es superar las
omisiones, inconsistencia y desechar las respuestas no significativas o errneas.
Tngase presente que la validez de sus resultados y conclusiones depende
de gran medida de la fidelidad de los datos utilizados. No existen
computadora que por s, corrija los errores de recopilacin.

UCV Lima este

Pgina 20

Mtodos estadsticos

Realizadas las correcciones o ajustes, se procede a la clasificacin o


establecimiento de categoras o intervalos, para la agrupacin de los datos.
Finalmente, se procede a la tabulacin o procesamiento de los datos, de
acuerdo a un plan de tabulaciones previamente definido.
Los cuadros y tablas estadstica como primera fase de la reduccin de
datos, facilita el clculo de los indicadores con los cuales se inicia la
descripcin, anlisis e interpretacin de los datos, variables e informacin
estadstica.
d. Anlisis e interpretacin de los datos
En esta etapa se aplica los argumentos matemtico y tericos de la
estadstica. A travs de mtodos estadstico se calcula indicadores y medidas de
resumen, se establecen relaciones entre variables, se estiman valores, se ejecuta
pruebas estadsticas, etc., como elementos de referencia para la descripcin,
anlisis e interpretacin del comportamiento de los datos, hacer inferencia
valida y obtener informacin de los elementos o unidades estudiadas.
e. Formulacin de conclusiones y preparacin de informe
En toda investigacin debe analizarse el cumplimiento de los objetivos,
en funcin de los resultados fundamentales, esta contrastacin permite elaborar
un resumen de los aspecto sustantivos, que luego se expresaran en forma de
conclusiones y sugerencia orientadora en la toma de decisiones.
5. ELECCIN DE LAS UNIDADES ESTADSTICAS
La elaboracin de una buena estadstica implica una definicin correcta de
las unidades que se van a considerar y una delimitacin de la materia a
investigar. Antes de iniciar la observacin y las operaciones de recuentos, el
estadstico debe tener una idea clara, tanto del conjunto que quiere estudiar
como de los individuos o unidades que constituye dicho conjunto.
La unidades estadstica deben definirse cuidadosamente teniendo en cuenta
los siguientes criterios:

Debe ser sencilla, de modo que se puede caracterizar con facilidad, que los
encargados de la recopilacin no tengan duda en su identificacin.
Debe ser precisa, de modo que facilite su identificacin y saber que
observar.
Fcilmente compresible y adaptada a los objetivos que se persiguen.
Debe ser semejantes, de manera que sean aditivo
Respetar las posibles definiciones oficiales o estatales.

UCV Lima este

Pgina 21

Mtodos estadsticos

RECOLECCIN DE DATOS

1. DEFINICIN
La recopilacin o coleccin de datos es el
momento en el cual el investigador se pone en
contacto con los objetos o elementos sometidos a
estudio, con el propsito de obtener los datos o
respuesta de las variables consideradas; a partir de
estos datos se prepara la informacin estadstica, se
calcula medidas de resumen e indicadores para el
anlisis estadstico.
Antes de recopilar o recoger datos, es importante analizar los objetivos
del estudios, precisar las variables e identificar las fuentes de datos, a fin de
definir qu datos hay que recopilar y cmo hacer esta tarea.
La formulacin del problema y del marco terico, la definicin de las
hiptesis y de los objetivos de la investigacin permite especificar los tipos de
informacin y las variables que son requeridas. Realizada esta tarea, el
investigador debe a continuacin seleccionar y elaborar las tcnicas e
instrumentos para recolectar los datos.
El trabajo de recoleccin de datos, en general se puede realizar mediante
dos modalidades:
La tcnica de investigacin documental o bibliogrfica
La tcnica de trabajo de campo
La fase de recoleccin de datos es uno de los puntos principales de la
investigacin, en consecuencia, debe dotarse de ciertas garantas para que los
datos cientficos puedan ser confiables y comparables, evitar las desviaciones y
la falta de representatividad.
2. INFORMACIN ESTADSTICA
La informacin estadstica, como datos procesados de acuerdos a ciertos
objetivos, es un medio que permite cuantificar aspecto de una realidad, de un
fenmeno o problema determinado, en un momento o periodo dado y un
mbito concreto. A partir de la informacin estadstica se puede describir y
explicar esa realidad, as como inferir conclusiones para definir un plan de
accin o desarrollo especifico. La informacin, en general, sirve para tomar
decisiones.

UCV Lima este

Pgina 22

Mtodos estadsticos

3. FUENTES DE DATOS
Las fuentes de datos es el lugar, la institucin, las personas o elementos
donde estn o que poseen los datos que se necesitan para cada una de las
variables o aspecto de la investigacin o estudio.
En

general se puede disponer de cinco tipos de fuentes de datos:


Las oficinas estadsticas
Registros administrativos
Documentos
Encuesta o censos
Los elementos o sujetos

Las tres primeras fuentes son de tipo administrativos y constituyen fuentes


secundarias; por su parte, las dos ltimas corresponde a la investigacin
estadstica, ya que permiten obtener datos originales, intencionales y de primera
mano, es decir constituye fuentes primarias.
4. TCNICA DE RECOLECCIN
La tcnica de recoleccin son diversas y depende de: la naturaleza del
objeto de estudio, de las posibilidades de acceso o contacto con los elementos
investigados, del tamao de la poblacin o muestra, de los recursos y de las
oportunidades de obtener datos. Las tcnicas tambin estn asociadas al tipo y
naturaleza de la fuente de datos.
Entre las tcnicas ms frecuentes se tienen:
a. La observacin: La observacin en el proceso de investigacin es la accin
de mirar con rigor, en forma sistemtica y profunda, con los intereses de
descubrir la importancia de aquellos que se observa. La observacin es el
mtodo bsico que se utiliza para adquirir informacin acerca del mundo que
nos rodea, y por lo tanto, constituye la tcnica primordial de la investigacin
cientfica. La observacin puede tener lugar en situaciones autenticas de la vida
ordinarias o tambin en el laboratorio.
b. Los documentos: La tcnica documental es un tipo de observacin que
recopila o busca sus datos en documentos, fuentes o graficas de todo tipo.
c. La entrevista: La entrevista es una situacin de interrelacin o dialogo entre
personas, es una tcnica donde una persona llamada entrevistador, solicita al
entrevistado, le proporcione algunos datos o informacin. El xito de la
entrevista como tcnica de recoleccin, depende de la eficiencia del trabajo del
entrevistador.
d. La encuesta: La encuesta es una tcnica de recoleccin de datos, donde se
obtiene la informacin tal como se necesita, preparada con objetivos estadstico.
Permite observar y registrar caractersticas en las unidades de anlisis de una
UCV Lima este

Pgina 23

Mtodos estadsticos

determinada poblacin o muestra, delimitada en el tiempo y en el espacio. En


toda encuesta se hace uso de un cuestionario, cuya respuesta se registra en el
formulario o cdula.
Cuando una encuesta est dirigida a la totalidad de elementos de una
poblacin, se llama censo; en tanto; cuando est dirigido a una parte
representativa de la poblacin, se llama encuesta por muestreo.
5. INSTRUMENTO DE MEDICIN
a. El cuestionario: Este es un instrumento constituido por un conjunto de
preguntas sistemticamente elaboradas, que se formula al encuestado o
entrevistado, con el propsito de obtener los datos de las variables
consideradas en el estudio. Cuando las preguntas se organizan y se imprimen, se
obtiene el formulario o cdula, que es el instrumento que se utiliza para
registrar las respuestas.

ORGANIZACIN Y PRESENTACIN DE DATOS


(VARIABLE CUALITATIVA)

Cuando se realiza la recopilacin de antecedentes


con fines estadsticos, se obtiene una gran cantidad de
datos, algunas veces estos estn en su forma natural o
emprica (fuente primarias) y otras ya estn organizadas
en tablas, cuadros y grficos (fuentes secundarias).
Los datos pueden estar incompletos, incorrectos,
desordenados, pero en todos los casos constituye datos
bsicos para iniciar un estudio, conocer y analizar el comportamiento y las
caractersticas de los elementos de una poblacin.
En el trabajo estadstico, siempre se dispone de muchos datos que,
definitivamente tienen que ser clasificados, ordenados y presentados
adecuadamente, de tal manera que facilite la compresin, descripcin y anlisis
del fenmeno estudiado y obtener conclusiones vlidas para la toma de
decisiones.
La organizacin y presentacin de los datos estadsticos, supone realizar
los siguientes pasos:

UCV Lima este

Pgina 24

Mtodos estadsticos

a. Evaluacin y crtica: Consiste en inspeccionar la validez y confiabilidad de


los datos, para corregir los errores y omisiones de acuerdo a ciertas reglas
fijas. A partir de datos incorrectos no se pueden obtener buenos resultados.
b. Codificacin: Es una tcnica mediante la cual los datos o respuestas se
convierten en un nmero, smbolo o lenguaje que permita su procesamiento o
tabulacin electrnica. La codificacin implica la definicin de criterios de
clasificacin y de categorizacin de las variables con miras a formular el plan
de tabulacin.
c. Clasificacin: Consiste en establecer las categora de las variables.
d. Procesamiento o tabulacin de datos: Es la contabilizacin o registro del
nmero de casos en cada una de las categora de la variables, de acuerdo al
plan de tabulacin previamente establecido.
e. Presentacin de los datos: Donde los resultados de la tabulacin, una vez
evaluados, se presenta en cuadros, tablas y grficos. La presentacin de datos
implica tener la informacin estadstica organizada para proceder al anlisis e
interpretacin de los resultados y de los aspecto considerados de la poblacin en
estudio.
En el trabajo estadstico, lo que se tiene disponible en un primer
momento es un material numrico, producto de la observacin o recopilacin
de datos, que son categorizados, ordenados, procesados y presentados en
cuadros o grficos; hay un proceso de resumen estadstico que se concreta con
el clculo de indicadores.
Existen dos formas de presentar ordenadamente los datos estadsticos:
En forma tabular, como son los cuadros y tablas estadsticas
Mediante grficos y diagramas
1. TABLA DE FRECUENCIA
Son tablas de trabajos estadsticos, que presenta la distribucin de un
conjunto de elementos de acuerdo a las categoras de las variables, en ellas se
observa la frecuencia o repeticiones de cada uno de los valores de la variables,
que se obtienen despus de realizar la operacin de tabulacin, la tabla
presenta los diversos tipo de frecuencia a la vez se utiliza para organizar los
datos y calcular algunos indicadores, medidas de resumen o estadgrafo.
2. PARTES PRINCIPALES DE UNA TABLA DE FRECUENCIA
a. Nmero de cuadro, es el cdigo o elemento de identificacin que permite
ubicar el cuadro en el interior de un documento. El nmero se anota junto
UCV Lima este

Pgina 25

Mtodos estadsticos

con la palabra cuadro, por ejemplo cuadro N 3.3. Indica que es el tercer
cuadro del captulo tres.
b. Ttulo, es la descripcin resumida del contenido del cuadro, la redaccin del
ttulo debe ser breve, claro y completo de modo que se pueden deducir sin
ambigedad que tipo de informacin contiene el cuadro.
c. Concepto o encabezamiento, es la descripcin de las filas y columnas de
un cuadro estadstico, el encabezamiento se ubica en la parte superior del
cuerpo del cuadro. ndica las variables y sus categoras o intervalos, tambin
puede indicar un periodo de tiempo.
d. Cuerpo del cuadro, es el contenido numrico de los cuadros. Es la parte
donde se colocan los datos correspondientes a la caractersticas o variables
indicados en el encabezamiento o en los conceptos, es decir presenta la
distribucin de los elementos segn la clasificacin en categora de las
variables.
e. Notas de pie o llamadas, se usa para algunos trminos o siglas, y tambin
para indicar que elementos estn o no incluidos en algunos de los conceptos
del cuadro.
f. Fuentes, es la indicacin al pie del cuadro, que sirve para nombrar la
publicacin, entidad, estudio o fuentes de donde se obtuvieron los datos
utilizados para construir el cuadro. La identificacin de la fuente permite, si
fuera el caso, comprobar la informacin o para obtener informacin
complementaria.
Hay dos tipos de fuentes: primaria, cuando se obtiene directamente de la
unidad de anlisis o cuando se recurre a los propios formularios de una
encuesta; secundaria, cuando se recurre a documentos, boletines o cuadros
estadsticos publicados.
g. Nota de unidad de medida, se escribe debajo del ttulo original, se usa
cuando se abrevia la escritura de las cifras y para expresar en que unidades
estn expresada la variables.
h. Elaboracin, es una indicacin que se coloca debajo de la fuente y sirve para
mencionar el responsable, que utilizando datos originales o de la fuente,
elabor el cuadro estadstico final; indicando la responsabilidad de la publicacin
del cuadro.
3. ELEMENTOS DE UNA TABLA DE FRECUENCIAS
a. Valor de la variable o intervalo de clases: Resulta de la clasificacin o
categorizacin de variable.

UCV Lima este

Pgina 26

Mtodos estadsticos

b: Frecuencia absoluta: Es el nmero de veces que se repite un determinado


valor de la variable; en el caso de los intervalos es el numero de observaciones
comprendido en dicho intervalo; est representado por
fi
c. Frecuencia relativa: Es el cociente de la frecuencia absoluta entre el total de
f
hi i
datos, est representado por hi
n
d. Frecuencia porcentual: Es la multiplicacin de la frecuencia relativa por 100
pi hi * 100%
e. Frecuencia absoluta acumulada: Es el que resulta
sucesivamente las frecuencias absoluta, se representa por FL

de

acumular

Fk f i f 1 f 2 ...... f k
i 1

f. Frecuencia relativa acumulada


Es el que resulta de acumular o sumar sucesivamente las frecuencias relativas, se
representa por Hi
k

H k hi h1 h2 ...... hk
i 1

g. Frecuencia porcentual acumulada


Es el que resulta de acumular o sumar sucesivamente las frecuencias porcentuales,
se representa por Pi
k

Pk pi p1 p 2 ...... p k
i 1

4. PROPIEDADES DE LAS FRECUENCIAS

Las frecuencias absoluta y las frecuencias absoluta acumuladas son


nmeros enteros no negativos y no mayores que n.
Las frecuencias relativa y las frecuencias relativa acumulada son valores que
varan entre 0 a 1.
Las frecuencias porcentuales y porcentuales acumuladas son nmero que varan
de 0 a 100%.
La suma de todas las frecuencias absoluta es igual al tamao de la
muestra.
La suma de todas las frecuencias relativa es igual a la unidad.
La suma de todas las frecuencias porcentuales es 100%.
La ltima frecuencia absoluta acumulada es igual al tamao de la muestra.
La ltima frecuencia relativa acumulada es la unidad
La ltima frecuencia porcentual acumulada es 100%

UCV Lima este

Pgina 27

Mtodos estadsticos

5. TABLA DE FRECUENCIA Y GRFICOS PARA VARIABLE


CUALITATIVAS
La tabla de frecuencia tiene la siguiente forma:
C

C1

f1

h1

p1

C2

f2

h2

p2

C3

f3

h3

p3

C4

f4

h4

p4

La representacin grafica de la distribucin de frecuencia de variables


cualitativa, se hace comnmente por grfica de barras y de sectores.
EJEMPLO 1
En una entrevista a una muestra de 30 personas sobre su preferencia de
bebidas gaseosa por los tres colores: negro(N), rojo(R) , blanco(B) se ha
obtenido los siguiente resultados:

* Realizar el cuadro de frecuencia y los grficos.

UCV Lima este

Pgina 28

Mtodos estadsticos

SOLUCIN
TABLA DE DISTRIBUCIN DE FRECUENCIA DEL COLOR DE BEBIDA GASEOSA

BLANCO

12

0,40

40%

ROJO

10

0,33

33%

NEGRO

0,27

27%

COLOR DE BEBIDA

27%

40%
33%

BLANCO
ROJO
NEGRO

El 40% de encuestados tiene preferencia el color blanco como bebida gaseosa.

UCV Lima este

Pgina 29

Mtodos estadsticos

ACTIVIDADES
1. Al investigar el nivel socioeconmico en las modalidades: bajo (B), medio
(M), alto (A) de 50 familia, se obtuvo los siguientes datos:

Construir la distribucin de frecuencia y trazar su graficas.


2. El siguiente cuadro se tiene la clasificacin de un grupo de pacientes que
se le hizo un Depistaje de cncer, s indica que el paciente tiene
cncer, no indica que el paciente no tiene cncer. Realizar el anlisis
descriptivo del conjunto de datos.

UCV Lima este

si

no

si

no

no

si

si

no

si

si

si

no

no

si

no

no

si

no

no

si

no

si

si

no

no

si

no

no

no

no

Pgina 30

Mtodos estadsticos

3. Un estudio de 50 embarazo proporcion los siguientes datos sobre la


Complicacin del embarazo s indica que s hubo complicaciones, no
indica que no hubo complicaciones, realizar la tabla de frecuencia y grfico.

UCV Lima este

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

no

Pgina 31

Mtodos estadsticos

GLOSARIO

Defina brevemente, con sus propias palabras, cada trmino de la lista.

Operacionalizacin: .

Fuente de datos:

Observacin: ..

Documento:

Entrevista: ..

Encuesta:

Cuestionario: .

Codificacin: .

Tabla de frecuencia: ..

Frecuencia absoluta: ..

Frecuencia relativa:

Frecuencia porcentual: ..

Frecuencia absoluta acumulada:

Frecuencia relativa acumulada:

Frecuencia porcentual acumulada: .

UCV Lima este

Pgina 32

Mtodos estadsticos

AUTOEVALUACIN
1. Quin produce el conocimiento cientfico?
a) El estadstico
c) El investigador
b) El matemtico
d) El encuestador
2.

Cundo el investigador se pone en contacto con los objetos sometido a


estudio se llama?
a) Recopilacin de informacin
c) Estadstica
b) Poblacin
d) Muestra

3.

Cmo se llama la etapa donde se aplica los argumentos matemtico y


terico de la estadstica?
a) Ciencias
b) Anlisis estadstico
c) Frecuencia absoluta
d) Frecuencia relativa

4. La accin de mirar con rigor se llama


a) Observacin
b) Informacin
c) Diagnstico
d) Ninguna
5. La tcnica que recopila o busca en fuente graficas se llama
a) Libro
b) Cuestionario
c) Documento
d) Ninguna
6. La tcnica que pone en interrelacin a dos personas se llama
a) Entrevista
b) Dilogo
c) Visita
d) Ninguna
7. La tcnica mediante el cual la respuesta se convierte en nmero se llama
a) Frecuencia
b) Porcentaje
c) Relativa
d) Codificacin
Solucin
1 .- c

2 .- a

UCV Lima este

3 .- b

4 .- a

5 .- c

6 .- a

7.- d

Pgina 33

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 34

Mtodos estadsticos

ORGANIZACIN Y PRESENTACIN DE DATOS CUANTITATIVOS

1. INTRODUCCIN
En
esta sesin los
alumno conocern los
procedimiento matemtico que se debe seguir
para
elaborar una tabla de frecuencia y grafico para una
variable cuantitativa.
2. TABLA
DE
FRECUENCIA
CUANTITATIVA DISCRETAS

GRFICOS

PARA

VARIABLE

La tabla de frecuencia tiene la siguiente forma:

x1

f1

h1

p1

F1

H1

P1

x2

f2

h2

p2

F2

H2

P2

x3

f3

h3

p3

F3

H3

P3

x4

f4

h4

p4

F4

H4

P4

La representacin grafica ms comn de una distribucin de frecuencias de


variable cuantitativa discreta es del tipo bastn y el de escalera.

UCV Lima este

Pgina 35

Mtodos estadsticos

EJEMPLO 1
Construir la distribucin de frecuencia y grfico del nmero de hijos por
familia en una muestra de 30 hogares, si se han observado los siguientes datos:

SOLUCIN
X = nmero de hijo por familia
X = 0, 1, 2, 3, 4
Frecuencia absoluta

f1 3

f2 8

f4 4

f3 6

f5 9

Frecuencia relativa

h1

3i
0.10
30

h2

8i
0.27
30

h4

4i
0.13
30

h5

9i
0.30
30

h3

6
0.20
30

Frecuencia porcentual

p1 0.10 * 100% 10%

p 2 0.27 * 100% 27%

p3 0.20 * 100% 20%

p 4 0.13 * 100% 13%

p5 0.30 * 100% 30%


UCV Lima este

Pgina 36

Mtodos estadsticos

Frecuencia absoluta acumulada


k

F1 f i 3
i 1

F2 f i 3 8 11
i 1

F3 f i 3 8 6 17
i 1

F4 f i 3 8 6 4 21
i 1

F5 f i 3 8 6 4 9 30
i 1

Frecuencia relativa acumulada


k

H 1 hi 0.10
i 1

H 2 hi 0.10 0.27 0.37


i 1

h3 hi 0.10 0.27 0.20 0.57


i 1

H 4 hi 0.10 0.27 0.20 0.13 0.70


i 1

UCV Lima este

Pgina 37

Mtodos estadsticos
k

H 5 hi 0.10 0.27 0.20 0.13 0.30 1


i 1

Frecuencia relativa acumulada


k

P1 p i 10%
i 1

P2 p i 10% 27% 37%


i 1

P3 p i 10% 27% 20% 57%


i 1

P4 p i 10% 27% 20% 13% 70%


i 1

P5 p i 10% 27% 20% 13% 30% 100%


i 1

TABLA DE DISTRIBUCIN DE FRECUENCIA SEGN EL NMERO DE


HIJO POR FAMILIA

0,10

10%

0,10

10%

0,27

27%

11

0,37

37%

0,20

20%

17

0,57

57%

0,13

13%

21

0,70

70%

0,30

30%

30

1,00

100%

UCV Lima este

Pgina 38

Mtodos estadsticos

1. TABLA
DE
CONTINUA

FRECUENCIA

PARA

VARIABLE

CUANTITATIVA

La tabla de frecuencia tiene la siguiente forma:


R = RANGO = MAX MIN
K = NMERO DE INTERVALO = 1 + 3.3LOG(n) =
A = AMPLITUD DEL INTERVALO = R/ K
L = LMITES
L Li 1
X = MARCA DE CLASE = i
2
La tabla de frecuencia para una variable cuantitativa continua debe tener
intervalos, marca de clases y todas las frecuencia tanto simple como acumulada.

LMITES X

L1 - L2

x1

f1

h1

p1

F1

H1

P1

L2 - L3

x2

f2

h2

p2

F2

H2

P2

L3 - L4

x3

f3

h3

p3

F3

H3

P3

L4 - L5

x4

f4

h4

p4

F4

H4

P4

La representacin grafica ms comn de una distribucin de frecuencias de


variable cuantitativa continua es histograma de frecuencia, el polgono de
frecuencia y la ojiva.

UCV Lima este

Pgina 39

Mtodos estadsticos

EJEMPLO 2
Construir la distribucin de frecuencia de los ingresos quincenales de 50
personas si los datos recopilados son:

63

23

10

59

53

89

53

72

60

65

64

36

70

52

67

76

49

57

51

61

57

44

56

62

62

67

73

64

43

85

60

61

56

59

68

71

67

62

35

56

62

61

51

63

78

26

55

81

60

99

Realizar la tabla de frecuencia y grficos.


Solucin
R = RANGO = MAX MIN = 99 10 = 89
K = NUMERO DE INTERVALO = 1 + 3.3LOG(n) = 1 +3.33log (50) = 6.67 = 7
A = AMPLITUD DEL INTERVALO = R/ K = 89 / 7 = 12.71 = 13
L = LIMITES

L1 MIN 10

L2 10 13 23

L3 23 13 36

L4 36 13 49

L5 49 13 62

L6 62 13 75

L7 75 13 88

L8 88 13 101

UCV Lima este

Pgina 40

Mtodos estadsticos

X = MARCA DE CLASE =

Li Li 1
2

X1

10 23
16.5
2

X2

23 36
29.5
2

X3

36 49
42.5
2

X4

49 62
55.5
2

X5

62 75
68.5
2

X6

75 88
81.5
2

X7

88 101
94.5
2

TABLA DE DISTRIBUCIN DE FRECUENCIA


SEGN INGRESO QUINCENAL

10 A 23

16,5

0,02

2%

0,02

1%

23 A 36

29,5

0,06

6%

0,08

8%

36 A 49

42,5

0,06

6%

0,14

14%

49 A 62

55,5

20

0,40

40%

27

0,54

54%

62 A 75

68,5

17

0,34

34%

44

0,88

88%

75 A 88

81,5

0,08

8%

48

0,96

96%

88 A 101

94,5

0,04

4%

50

1,00

100%

INGRESO QUINCENAL
25
10 A 23

20

23 A 36
36 A 49

15

49 A 62

10

62 A 75
75 A 88

88 A 101

0
1

UCV Lima este

Pgina 41

Mtodos estadsticos

ACTIVIDADES
1. Al averiguar el nmero de hijos de 50 empleados que estn registrado en
los archivos de una empresa se obtuvo los siguientes datos:

Construir la distribucin de frecuencia y trazar su grfica.


2. Se realiz una encuesta a una muestra de padres de familias de una I.E., para
averiguar el nmero de habitaciones que tienen sus respectivas viviendas y se
obtuvieron los siguientes resultados:

Construir la distribucin de frecuencia y trazar su grfica.

UCV Lima este

Pgina 42

Mtodos estadsticos

3. La inversin anual, en miles de


fueron:

dlares, de una muestra de 50 fbricas

11

15

36

25

17

39

19

75

101

125

27

18

29

33

20

30

37

79

105

129

28

41

33

22

10

26

27

82

109

138

34

12

27

31

25

46

24

85

112

140

14

18

26

35

24

23

31

90

116

142

Construir la distribucin de frecuencia y trazar su grfica.

4. A 50 trabajadores varones se le midi la puntuacin de Hamilton.


17,9

18,4

12,3

11,2

11,2

30,2 21,3

25,1

15,3

26,8 22,7

11,2

15,8

15,1

14,7

12,5

12,3

25,3

8,3

22,3

12,2

24,6 16,2

15,9

25,2 32,3 26,3 26,3

15,8

26,4

18,2

22,7 22,4

14,3

20,1 33,2 24,3

20,5 21,9

13,4

15,5

12,1

20,3 30,1

21,3

28,9

35,2

23,1

29,3 34,2

Construir la distribucin de frecuencia y trazar su grfica.

UCV Lima este

Pgina 43

Mtodos estadsticos

5. El peso de 50 productos en kilogramos son:

35.6

31.1

30.1

30.5

33.5

27.9

31.6

28.7

31.3

30.5

29.3

28.1

33.2

24.9

30.6

31.5

33.7

30.5

26.8

35.1

22.5

32.1

27.9

29.9

28.6

34.2

28.5

31.2

28.7

30.1

34.2

27.5

29.5

30.4

30.3

32.7

29.8

28.7

31.3

29.6

20,5

21,9

13,4

15,5

28,9

12,1

20,3

30,1

29,3

34,2

Elaborar una distribucin de frecuencia y su grafico respectivo.

6. A 50 sujetos se les midi la cantidad de alcohol consumido por semana, las


cuales se muestras en el siguiente conjunto de datos.

0,05

3,11

5,64

7,83

8,65 10,45 12,36 12,36 17,89 18,36

1,51

4,23

5,98

7,88

9,54 10,78 12,54 15,56 17,89 18,59

2,53

4,56

6,36

7,99

9,63

11,23 12,89 14,58 18,23 19,56

3,23

4,89

6,54

8,52

9,52

11,45 13,25 15,89 18,25 19,85

3,24

5,23

6,87

8,35

10,12 11,56 13,45 16,63 18,45 19,56

Elaborar una distribucin de frecuencia y su grfico respectivo.

UCV Lima este

Pgina 44

Mtodos estadsticos

GLOSARIO

Defina brevemente, con sus propias palabras, cada


trmino de la lista.

Encuesta: ..

Cuestionario: ...

Codificacin:

Tabla de frecuencia: ...

Frecuencia absoluta: ...

Frecuencia relativa: .

Frecuencia porcentual: ...

Frecuencia absoluta acumulada: ..

Frecuencia relativa acumulada: .

Frecuencia porcentual acumulada: ..

Grfico de la escalera:

Grfico del bastn:

Grfico del histograma:

Polgono de frecuencia: .

UCV Lima este

Pgina 45

Mtodos estadsticos

AUTOEVALUACIN
1. El consumo mensual de agua ( en metros cbicos) de ochenta fbricas se
tabul en una distribucin de frecuencia simtrica de 7 intervalos de
amplitud iguales a tres. Siendo la marca de clase del cuarto intervalo
igual a 19. si las frecuencias del primer y tercer intervalo son iguales a
5% y 15% del total respectivamente y si la quinta frecuencia acumulada
es de 85% del total. Reconstruir la distribucin de frecuencia
y los
grficos respectivos.
2. Los tiempos de vida til (en das) de un producto se tabularon en una
distribucin de frecuencia de 5 intervalos de igual amplitud con
frecuencia relativa acumulada 0.10, 0.25, 0.55, 0.80, 1.00 . Determine la
distribucin de frecuencia absolutas si la tercera frecuencia absoluta
acumulada es 11, si la segunda marca de clase es 10 y el lmite inferior
del cuarto intervalo es 16.
3. Los tiempo de vida til de un tipo de batera, se tabul en una distribucin
de frecuencia de 5 intervalos de igual amplitud con frecuencia relativa
acumuladas: 0,10 , 0,25 , 0,55 , 0,80 , 1.00. determine la distribucin de
frecuencia absolutas si la tercera frecuencia absoluta acumulada es 11, si la
segunda marca de clase es 6 y si el lmite inferior del cuarto intervalo es 12.
4. La nota de un examen aplicado a obreros de una fbrica se tabul en una
distribucin de frecuencia relativa de 3 intervalos de amplitud iguales a 5, la
nota mnima es 5 y el 48% de las notas son menores que 12, y si el 80%
de las notas son inferiores a 16. Reconstruir la distribucin de frecuencia.

UCV Lima este

Pgina 46

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.
3. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
6. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.

UCV Lima este

Pgina 47

Mtodos estadsticos

MEDIDAS DE TENDENCIA CENTRAL

1. INTRODUCCIN
Son estadgrafos que describen la posicin que ocupan una distribucin
de frecuencia alrededor de un valor de la variables.
Los estadgrafos son valores que de manera condensada representa en un
solo valor a una serie de datos y adems describen resumidamente el conjunto
de observaciones.
Los estadgrafos de posicin de uso ms frecuente
mediana, la moda, los deciles, cuartiles y percentiles.

son: la media, la

2. LA MEDIANA
La mediana o valor mediano de una serie de valores observado es el
numero que separa a la serie de datos ordenados en formas creciente en dos
partes iguales.
La mediana es una medida de posicin que depende del nmero de
datos observado y no de su valores de estos datos.
2.1 MEDIANA PARA DATOS NO TABULADOS
Para calcular la mediana para datos no tabulados se obtiene bajo el siguiente
criterio:
Cuando n es impar

ME X n 1
2

Ejemplo 1

2, 4, 5, 8, 10, 11, 13.


ME X n 1 X 7 1 X 4 8
2

Cuando n
Ejemplo 2

es par

X n / 2 X n 2 / 2
2

1, 4, 5, 7, 13, 15, 16, 19


ME

UCV Lima este

ME

X n / 2 X n 2 / 2
2

X 4 X 5 7 13

10
2
2
Pgina 48

Mtodos estadsticos

2.2 MEDIANA PARA DATOS TABULADOS (sin intervalo)


Si los valores de una variable discreta se tabulan en una distribucin de
frecuencia de la forma dato frecuencia, entonces la mediana ser aquel valor
de la variable que contenga a la primera frecuencia absoluta acumulada que
supere o sea igual a n/2.
Ejemplo 3
El nmero de hijos por familia se encuentra en la siguiente tabla hallar la
mediana.
El valor de la media es 2 porque es el valor de la variable que tiene a la primera
frecuencia absoluta acumulada que supera a la mitad.

11

17

21

30

2.3 MEDIANA PARA DATOS TABULADOS (con intervalo)


Si el valor de una variable discreta o continua se tabulan en una
distribucin de frecuencia por intervalos, la mediana se determina mediante la
siguiente frmula:
n

Fi 1

ME Li A 2
Fi Fi 1

Ejemplo 4
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la mediana.

UCV Lima este

Pgina 49

Mtodos estadsticos

INTERVALOS

10

23

23

36

36

49

49

62

20

27

62

75

17

44

75

88

48

88 101

50

Fi 1
49 13 25 7 55.32
ME Li A 2
Fi Fi 1
44 7

El 50% de los ingresos quincenales son menores o iguales a 55.32

2.4 VENTAJA DE LA MEDIANA

La suma de la diferencia de los datos respecto a su mediana es menor o


igual que la suma de las diferencias de esos datos respecto a cualquier
otro valor.
La mediana, a diferencia de la media, depende del nmero de datos y no
del valor de los datos. Por eso no est afectada de valores extremos.
La mediana puede ser calculada para distribuciones de frecuencia con
intervalos de diferente amplitud, siempre que se pueda determinar el lmite
inferior del intervalo de la mediana.

3. LA MODA
La moda de una serie de datos es aquel valor que se repite con mayor
frecuencia. Este promedio se usa cuando se requiere sealar el valor ms
comn de una serie de datos. La moda es una medida menos importante que
la mediana debido a su ambigedad. La moda no siempre existe y si existe,
no siempre es nica.
3.1 MODA PARA DATOS NO TABULADOS
Ejemplo 5
Sera el valor que se repite el mayor nmero de veces
5, 8, 8, 8, 8, 8, 8, 11, 15, 15, 15, 15,
entonces la moda sera 8 .

UCV Lima este

Pgina 50

Mtodos estadsticos

3.2 MODA PARA DATOS TABULADO (sin intervalo)


La moda sera aquel valor de la variable que tenga la frecuencia absoluta.
Ejemplo 6
El nmero de hijos por familia se encuentra en la siguiente tabla hallar la moda.

El mayor nmero de familia tiene 4 hijos.


3.3 MODA PARA DATOS TABULADO (con intervalo)
La moda para datos tabulado en tablas de frecuencia
encuentra mediante la siguiente frmula:
d1

MO Li A
d

d
1
2

con intervalo

se

Ejemplo 7
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la moda.
INTERVALOS

10

23

23

36

36

49

49

62

20

62

75

17

75

88

88 101

d1
17
49 13
MO Li A
60.55
17 3
d1 d 2
El ingreso quincenal ms frecuente es 60.55 .
UCV Lima este

Pgina 51

Mtodos estadsticos

4. MEDIA ARITMTICA
La media aritmtica se denomina simplemente media y comnmente se le
conoce como promedio, la media es el estadgrafo ms importante; se define y
calcula dividiendo la suma de los valores de la variables entre el nmero de
observaciones o valores.

La media que se obtiene a partir de n datos originales se denomina


media aritmtica simple.
La media obtenida a partir de los datos agrupados en tabla de frecuencia
se denomina media aritmtica ponderada.

4.1 MEDIA ARITMTICA PARA DATOS NO TABULADOS


La media aritmtica para datos no tabulados se obtiene mediante la
siguiente frmula:
n

___

i 1

Ejemplo 8
Hallar la media de las siguientes edades: 15, 16, 18, 15, 25.
n

___

i 1

89
17.8
5

4.2 MEDIA ARITMTICA PARA DATOS TABULADOS (sin intervalos)


La media aritmtica para datos tabulados se obtiene mediante la siguiente
frmula:
k

__

i 1

f i xi
n

Ejemplo 9
Hallar el nmero promedio de hijos por familia.

UCV Lima este

Pgina 52

Mtodos estadsticos
k

__

Solucin:

i 1

f i xi
n

71
2.36
30

4.3 MEDIA ARITMTICA PARA DATOS TABULADOS (con intervalos)


La media aritmtica para datos tabulados se obtiene mediante la
siguiente frmula:
k

__

f
i 1

xi

Ejemplo 10
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar el promedio.
f

INTERVALOS
10

23

23

36

36

49

49

62

20

62

75

17

75

88

88 101

4.4 PROPIEDADES DE LA MEDIA ARITMTICA

___

La suma total de n valores es igual x n .


La media de una constante es igual a la misma constante.
La media del producto de una constante por una variable, es igual al producto
de la constante por la media de la variable.
La media de la suma de dos variables, es igual a la suma de las medias de cada
una de dichas variables.
Si cada uno de los n valores de XI es trasformado en: YI = aXi + b,
siendo a y b constante, entonces, la media de los n valores es:
__

__

y a x b
La media aritmtica de datos tabulados, se calcula tambin utilizando las
frecuencia relativas.

UCV Lima este

Pgina 53

Mtodos estadsticos
__

x xi hi
i 1

La media de una muestra es igual a la media ponderada de su sub.


muestras donde los pesos son los tamaos respectivos.
k

__

__

n x
i 1
k

n
i 1

NOTA
La media aritmtica como estadgrafo de posicin de una distribucin
proporciona una idea de la posicin de los valores alrededor de la media.
La media es un valor promedio, por tanto no significa que todos los
valores observados resultan ser iguales.
La media siempre est influenciada por los valores extremos, sean mayores
o menores.
La media aritmtica no divide en dos partes iguales a un conjunto de
datos.

5. CUARTILES
Los cuartiles son los estadgrafos que divide a un conjunto de datos en
cuatro partes iguales y en total son tres cuartiles; se calcula utilizando la siguiente
frmula:
kn

Fi 1

k = 1, 2, 3
QK Li A 4
Fi Fi 1

Ejemplo 11
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el primer cuartil.

INTERVALOS
10 23
23 36
36 49
49 62
62 75
75 88
88 101

UCV Lima este

F
1
3
3
20
17
4
2

F
1
4
7
27
44
48
50

Pgina 54

Mtodos estadsticos

kn

Fi 1

36 13 12.5 7 39.58
Q K Li A 4
Fi Fi 1
27 7

El 25% de los ingresos quincenales son menores o iguales a 39.58


Ejemplo 12
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el tercer cuartil.

INTERVALOS

10

23

23

36

36

49

49

62

20

27

62

75

17

44

75

88

48

88 101

50

3n

Fi 1

62 13 37.5 27 65.68
Q3 Li A 4
Fi Fi 1
44 7

El 75% de los ingresos quincenales son menores o iguales a 65.68

6. DECILES
Es el estadgrafo que divide a un conjunto de datos en 10 partes iguales; se
calcula mediante la siguiente frmula:
kn

Fi 1

DK Li A 10
Fi Fi 1

Ejemplo 13
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el decil 8.

UCV Lima este

Pgina 55

Mtodos estadsticos

INTERVALOS

10

23

23

36

36

49

49

62

20

27

62

75

17

44

75

88

48

88 101

50

kn

Fi 1

62 13 40 27 71.94
D K Li A 10
Fi Fi 1
44 27

El 80% de los ingresos quincenales son menores o iguales a 71.94


7. PERCENTILES
Es el estadgrafo que divide a un conjunto de datos en 100 partes iguales
kn

Fi 1

100

PK Li A
Fi Fi 1

Ejemplo 14
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla.
Hallar el percentil 35.
INTERVALOS

UCV Lima este

10

23

23

36

36

49

49

62

20

27

62

75

17

44

75

88

48

88 101

50
Pgina 56

Mtodos estadsticos

kn

Fi 1

49 16 17.5 7 55.83
PK Li A 100
Fi Fi 1
27 7

El 35% de los ingresos quincenales son menores o iguales a 55.93 soles.

ACTIVIDADES
1. La inversin anual, en miles de dlares, de una muestra de 50 fbrica en
compra de insumo estn distribuido en la siguiente tabla de frecuencia. Hallar
las medidas de tendencia central.
INTERVALOS

20 -

50

12

50 -

80

80 - 110

110 - 140

15

140 - 170

10

2. A 50 obreros varones se le midi la puntuacin de Hamilton y se le


represent en la siguiente tabla de frecuencia. Hallar las medidas de tendencia
central.

UCV Lima este

INTERVALOS

21,3 - 24,3

24,3 - 27,3

10

27,3 - 32,3

15

32,3 - 37,3

10

37,3 - 42,3

10

Pgina 57

Mtodos estadsticos

3. Los costos de fabricacin de 20 productos son los siguientes:


9,35

8,56

9,00

8,63

9,60

9,00

8,56

9,5

9,46

7,52

9,99

8,00

9,53

9,77

9,54

7,56

9,20

8,56

9,36

8,56

Si el precio de venta de cada producto es tres veces su costo de fabricacin


menos 5 soles. Calcular la utilidad media por producto.
4. El sueldo promedio de 200 empleados de una empresa es 400. Se
propone dos alternativas de aumento: a) 75 soles a cada uno, b) 15% de
su sueldo ms 10 soles a cada uno. Si la clnica dispone a lo ms de
94000 soles para pagar sueldos, Cul alternativa es la ms conveniente?
5. De una central telefnica de una empresa salieron 70 llamadas de menos
tres minutos, promediando 2.3 minutos, 40 llamadas de menos de
minutos pero no menos de tres minutos, promediando 6.4 minutos, y
llamadas de al menos 10 minutos, promediando 15 minutos. Calcular
duracin promedio de todas las llamadas.

UCV Lima este

de
10
10
la

Pgina 58

Mtodos estadsticos

GLOSARIO

Defina brevemente, con sus propias palabras, cada trmino de la lista.

Mediana: .

Moda: .

Media: .

Percentiles: ..

Cuartiles: ..

Deciles: .

Asimetra positiva: ..

Asimtrica negativa: ..

AUTOEVALUACIN
1. Los egresos de una empresa varan de 3000 a 8000 soles distribuido en
forma simtrica en cinco intervalos de igual amplitud, con el 15%, 20%
y 30% de casos en el primer, segundo y tercer intervalo
respectivamente. Calcule el egreso promedio
2. En un examen de estadstica participaron tres grupos A, B y C con un total de
180 alumnos; habiendo obtenidos nota promedio general de 72 puntos. Los
puntajes promedio de los grupos A y B fueron 75 y 62, y estaba constituido
por 80 y 60 alumnos respectivamente. Cul es la nota promedio del grupo
C?
3. En el control de calidad de 120 lotes de determinado producto, se observ
el nmero de artculos defectuosos por lote, obteniendo los siguientes
resultados: el 5% de los lotes no tiene artculos defectuoso, el 15% tiene un
defectuoso, el 25% tiene 2 defectuosos, el 45% tiene 3 defectuosos y el
resto contiene 4 defectuoso.

UCV Lima este

Pgina 59

Mtodos estadsticos

4. Cuatro fabricas A, B, C y D, producen un mismo tipo de objeto. La fbrica B


produce el doble d C, la D 10% menos que la C y la A el 60% menos
que la B. si los costos de produccin por cada unidad del objeto de esta
fbricas son respectivamente: 0.2, 0.3, 0.2 y 0.5, calcule el precio medio de
venta si se sabe que la fbrica gana 20% por unidad vendida.
5. El sueldo medio de los obreros de una fbrica es de 286 dlares Qu
porcentaje de hombres y mujeres trabajan en la fbrica si su sueldo medio
respectivo son 300 y 260 dlares?

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 60

Mtodos estadsticos

MEDIDA DE DISPERSIN

1. INTRODUCCIN
Las medidas de tendencia central no son suficientes para describir un conjunto
de valores de alguna variable estadstica. Los promedios determinan el centro, pero
nada indica de cmo estn situados los datos respecto al centro.
En primer lugar, se necesita una medida de nivel de dispersin o la
variabilidad de los datos con respecto a su centro con la finalidad de ampliar la
descripcin de los datos o de comparar dos o ms serie de datos.
En segundo lugar , se necesita una medida de grado o nivel de la asimetra o
la deformacin en ambos lados del centro de una serie de datos, con el fin de
describir la forma de la distribucin de los datos. Esta medida se denomina ndice
de asimetra.
En tercer lugar, se necesita una medida que nos permita comparar el
apuntamiento o curtosis de distribucin simtrica con respecto a la distribucin
simtrica normal. Esta medida se denomina ndice de apuntamiento o curtosi.
2. DEFINICIN
Las medidas de dispersin o variabilidad son nmeros que miden el
grado de separacin de los datos con respecto a un valor central, que
generalmente es la media aritmtica.
Las principales medidas de dispersin son:

El
El
La
La
El

rango
rango intercuartil
varianza
desviacin estndar
coeficiente de variacin

3. RANGO O RECORRIDO
El rango o recorrido, de una serie de datos, es la diferencia entre sus
valores mximo y mnimo.
R = max min
El rango es una medida de dispersin muy fcilmente calculable, pero es
muy inestable, ya que depende nicamente de los dos valores extremos. Su
valor puede cambiar grandemente si se aade o elimina un solo dato. Por
tanto su uso es muy limitado.
UCV Lima este

Pgina 61

Mtodos estadsticos

4. RANGO INTERCUARTIL
El rango intercuartil, es la diferencia entre sus cuartiles tercero y
primero.
RI = Q3 Q1
El rango intercuartil es una medida que excluye el 25% ms alto y el
25% ms bajo, dando un rango dentro del cual se encuentra el 50% central
de los datos observados y a diferencia del rango total no se encuentra
afectada por los valores extremos.
5. LA VARIANZA
La varianza, es una medida que cuantifica el grado de dispersin o de
variacin de los valores de una variable cuantitativa con respecto a la media
aritmtica. Si los valores tienden a concentrarse alrededor de su media, la
varianza ser pequea. Si los valores tiende a distribuirse lejos de la media, la
varianza ser grande.
La varianza es la media aritmtica de los cuadrados de las diferencia de
los datos con respecto a su media aritmtica.
a. La varianza para datos no tabulados
n

( xi U ) 2
i 1

X
i 1

2
i

Ejemplo 1
Hallar la varianza al siguiente conjunto de datos 5, 8, 12, 19, 14.
b. La Varianza para datos tabulados (sin intervalo)
n

i 1

fi (X i U )2
N

i 1

X i2 f i
N

Ejemplo 2
Hallar la varianza de la tabla siguiente, que representa el nmero de hijos por
familia.
X
f
0
3
1
8
2
6
3
4
4
9
UCV Lima este

Pgina 62

Mtodos estadsticos

c. La Varianza para datos tabulados (con intervalo)


n

i 1

fi (X i U )2
N

i 1

X i2 f i
N

Ejemplo 3
Los ingresos quincenales de 50 personas estn representados en la siguiente tabla
hallar la varianza.
INTERVALOS

10

23

23

36

36

49

49

62

20

62

75

17

75

88

88 101

Propiedades de la varianza

Para cualquier distribucin la varianza es siempre una cantidad no negativa.


Si el valor de las observaciones son todos iguales, entonces la varianza es cero.
La varianza de una constante es cero.
La varianza del producto de una constante por una variable, es igual al
cuadrado de la constate por la varianza de la variable.
La varianza de la suma de una variable mas una constante, es igual a la
varianza de la variable.
6. DESVIACIN ESTNDAR
La desviacin estndar es la raz cuadrada positiva de la varianza 2
7. COEFICIENTE DE VARIACIN
El coeficiente de variacin es una medida de dispersin relativa, que se
define como la desviacin estndar dividido por la media aritmtica.
El coeficiente de variacin es una medida muy til para comparar la
variabilidad de dos o ms serie de datos que tenga distinta unidades de
medidas o media aritmtica diferente.

UCV Lima este

Pgina 63

Mtodos estadsticos

C.V

* 100%

8. USO DE LAS MEDIDAS DE VARIACIN


La varianza viene expresada en unidades cuadrticas en las que vienen
expresado los datos. Las desviacin estndar viene expresada en la misma
unidades en las que viene expresados los datos. El coeficiente de variacin
viene expresada en nmeros abstractos (suprimiendo las unidades en las que
vienen expresado los datos)
Si dos o ms serie tienen medias aritmticas iguales y dispersiones
diferentes entonces la serie de mayor variacin es aquel que tiene mayor
medida de dispersin. La serie de menor variacin es aquella que tiene menor
medida de dispersin.
Si dos o ms serie de datos, no tienen medias iguales o no tienen la
misma unidades de medicin, entonces la serie de mayor variacin es aquella
que tenga mayor coeficiente de variacin.
NOTA
Las medidas de dispersin ms usuales son:
MUESTRA - POBLACIN
Rango

Varianza

Desviacin estndar

DATOS SIN AGRUPAR


N

X
i 1

S2

i 1

n 1

DATOS AGRUPADOS
K

2
UCV Lima este

X
i 1

U . fi

S2

m
i 1

x . fi
2

n 1
Pgina 64

Mtodos estadsticos

ACTIVIDADES
1.

A 50 varones se le midi la puntuacin de Hamilton y se le represent en la


siguiente tabla de frecuencia, hallar las medidas de dispersin.

INTERVALOS

21,3 - 24,3

24,3 - 27,3

10

27,3 - 32,3

15

32,3 - 37,3

10

37,3 - 42,3

10

2. En un estudio se obtuvieron estas observaciones sobre el permetro en


centmetro de 100 mesa el cual est representado en la siguiente tabla, hallar
las medidas de dispersin.
INTERVALOS

10 - 20

20

20 - 30

30

30 - 40

10

40 - 50

15

50 - 60

25

3. A 50 sujetos se les midi la cantidad de alcohol consumido por semana, la


cual se muestra en la siguiente tabla. Hallar las medidas de dispersin. El coeficiente
intelectual de 40 obreros est distribuido en la siguiente tabla. Hallar las medidas
de posicin.

UCV Lima este

INTERVALOS

0 - 4

4 - 8

10

8 - 12

12 - 16

15

16 - 20

15
Pgina 65

Mtodos estadsticos

4. La siguiente tabla corresponde a la distribucin de una muestra de empleados del


Ministerio de Educacin segn su tiempo de servicios (aos). Halle e intrprete: la
media aritmtica, la mediana y la moda y ubicar estos valores en el Histograma
correspondiente.
Tiempo de
servicios
[0 4>
48
8 12
12 16
16 20
20 24
24 28
28 - 32

N
empleados
11
13
20
17
12
6
4
2

5. La inversin anual, en miles de dlares, de una muestra de 50 empresa


estn distribuido en la siguiente tabla de frecuencia. Hallar las medidas de
dispersin.
INTERVALOS

UCV Lima este

20 -

50

12

50 -

80

80 - 110

110 - 140

15

140 - 170

10

Pgina 66

Mtodos estadsticos

GLOSARIO

Defina brevemente, con sus propias palabras, cada trmino de


la lista.

Rango:

Intercuartil: .

Varianza: .

Desviacin estndar: .

Coeficiente de variacin: .

Homogneo: ..

Heterogneo: .

AUTOEVALUACIN
1. En un test aplicado a 100 personas se obtuvo la siguientes informacin: los
puntajes se tabularon en una distribucin de frecuencia simtrica de 5
intervalos de amplitud iguales, siendo el puntaje mnimo 40 y el mximo
de 90. la frecuencia absoluta del intervalo central fue de 40 y del quinto
de 10. calcular la varianza.
2. Una prueba de conocimiento, A se calific sobre 20 puntos dando una
media de 12 y una desviacin estndar de 2 puntos. Mientras que una
prueba de aptitud ,B se calific sobre 100 puntos, dando una media de
70 y una desviacin estndar de 5 En cul de las dos pruebas los
puntajes son ms homogneos?
3. Los sueldo de 150 trabajadores de una empresa tiene un coeficiente
variacin del 5% en el mes de agosto. para el mes de septiembre hay
aumento a cada trabajador el 20% de su sueldo ms una bonificacin
60$ y el coeficiente de variacin baja a 4%. Calcular la media y
desviacin estndar de los sueldos del mes de agosto.

UCV Lima este

de
un
de
la

Pgina 67

Mtodos estadsticos

4. La distribucin de los sueldos de los empleados de dos empresa A y B se


tabularon en tres intervalos de igual amplitud en cada caso, siendo las
frecuencias absoluta del primero al tercero de 10, 30, 30 y de 30, 50, 20.
respectivamente en A y B. Si los sueldos mnimo y mximo son de 50 y
200 en A, y de 60 y 240 en B. En qu empresa los sueldo son ms
homogneos?

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 68

Mtodos estadsticos

UNIDAD DIDCTICA 2: PROBABILIDADES E INFERENCIA


Capacidad de Unidad: Aplica probabilidades en situaciones reales y
analiza resultados, teniendo en cuenta la teora de probabilidad

PROBABILIDAD BSICA

1. EXPERIMENTO
Es un proceso mediante el cual
resultado de una observacin.

se obtiene un

1.2 CLASIFICACIN DE EXPERIMENTOS


Los experimentos se dividen en dos clases:
1.2.1 Experimento determinstico
Es aquel experimento que est completamente determinado y puede describirse
por una frmula matemtica llamado tambin modelo determinsticos.
1.2.2 Experimento no determinstico
Es aquel
resultados.

experimento donde no se puede predecir

con

exactitud

los

1.2.3 Experimento aleatorio


Es todo proceso que consiste de la ejecucin de un acto o prueba una
o ms veces, cuyo resultados en cada prueba depende del azar y en
consecuencia no se puede predecir con certeza y cumple ciertas caractersticas:
Que sea repetible en igualdad de condiciones.
Que se pueda describir el conjunto de todos los resultados posibles aunque no se
pueda asegurar un resultado en particular.
Si se repite un nmero grande de veces debe aparecer cierta regularidad
estadstica.
Ejemplo
E1: Lanzar
E2: Lanzar
E3: Lanzar
E4: Medir

un dado
una moneda tres veces
una moneda tantas veces hasta que aparezca la primera cara
la vida til en horas de una marca de artefacto elctrico

UCV Lima este

Pgina 69

Mtodos estadsticos

1.2.3.1. Clasificacin de experimento aleatorio


Los experimentos aleatorios se clasifican en:
a. Experimento simple
Es aquel experimento que est formado por un solo acto o prueba.
Ejemplo
Lanzar un dado
Lanzar una moneda
b. Experimento compuesto
Un experimento se dice que es compuesto, si consiste de dos o ms
experimento simples. A la vez se clasifican en:

Experimento unido por la


o
excluyente: Un experimento
compuesto E, se dice que es una combinacin de los experimento
simples, E1 , E2
si, solo si el experimento E ocurre, cuando el
experimento E1 o E2 ocurre pero no ambos.
Ejemplo
Lanzar un dado o una moneda.
Extraer una ficha de la urna 1 o de la urna 2.

Experimento unido por la y: Un experimento compuesto E, se dice


que es una combinacin de los experimento simples, E1 , E2 si, solo si el
experimento E ocurre, cuando el experimento E1 y E2 ocurre en forma
simultneas o consecutivas.
Ejemplo
Lanzar un dado y una moneda simultneamente.
Extraer dos fichas de una urna.

2. ESPACIO MUESTRAL:
Se denomina espacio muestral al conjunto que contiene todos los
resultados posible de un experimento aleatorio.
Cada resultado posible de un experimento aleatorio es un elemento del
espacio muestral. A cada elemento del espacio muestral se denomina tambin
punto muestral. Esto es, el espacio muestral se describe por:
= / es un punto muestral
Si el espacio muestral tiene un numero finitos de elementos es posible
en listar a todos estos, y si el nmero de elementos es grande o infinito el
espacio muestral se describir mediante un enunciado o regla de
correspondencia.

UCV Lima este

Pgina 70

Mtodos estadsticos

2.1 CLASIFICACIN DE LOS ESPACIOS MUESTRALES


Por el nmero de elementos o puntos mustrales, los espacios mustrales
se clasifican en:
Discreto finitos, consisten de un numero finito de elementos.
Discreto infinito, consiste de un nmero infinito numerable de elementos.
Continuos, consiste de un nmero infinito no numerable de elementos.
Ejemplo

Observar el lanzamiento de una moneda


S1 cara , sello c , s

Observar el lanzamiento de un dado

S2

1,

2 , 3, 4 , 5 , 6

Medir la duracin de un equipo electrnico


S3 t : t 0

Contar el nmero de vehculos que pasan por un cruce en lapsos de un minuto

El lanzamiento de dos dados

Lanzamiento de un dado y una moneda

3. EVENTOS: A, B, C..Z
Se denomina evento a cualquier subconjunto de un espacio muestral.
3.1 CLASE DE EVENTOS
Los eventos se clasifican en:
Eventos imposible, es aquel que no tiene
puntos muestrales, en
consecuencia no ocurre nunca.
Eventos unitarios o elementales, w es aquel que contiene un solo
punto muestral.
Eventos compuestos, es el que consiste de dos o ms eventos.
Evento seguro o cierto, es el mismo espacio muestral, ya que es el
subconjunto que contiene a todos los eventos elementales.
1) E1 : Lanzamiento de una moneda.
S1 cara , sello c , s
Podremos plantear los siguientes eventos:

UCV Lima este

A1: que salga cara

A1 = { c }

A2 : que salga sello

A2 = ______

Pgina 71

Mtodos estadsticos

2) E2 :Lanzamiento de un dado

S2

1,

2 , 3, 4 , 5 , 6

B1 : que salga nmero par

B1 = _______________________

B2 : que salga nmero impar

B2 = _______________________

B3 : que salga nmero 4 5

B3 = _______________________

3.2 OPERACIONES CON EVENTOS


a. Unin de eventos
Se denomina unin de los eventos A y B, al evento A B que consiste
de todos los puntos mustrales que pertenecen al evento A o al evento
B, o ambos.
A B = {w / w A w B}
b. Interseccin de eventos
Se denomina interseccin de los eventos A y B al eventos AB que
consiste de todos los puntos mustrales que son comunes al evento A y al
evento B.
A B = {w / w A w B}

c. Diferencia de evento
La diferencia del evento A menos B es el evento A B, que consiste
de todos los puntos mustrales que pertenecen al evento A y no pertenecen
al evento B.
A B = {w / w A w B}
d. Complemento de un evento
Si A est incluido en B entonces el complemento est formado por
aquellos elementos que estn fuera del conjunto A.
AC = {w B / w A}
e. Eventos disjuntos
Dos eventos A y B son mutuamente excluyentes o disjuntos, si no tiene
elementos en comn, esto es si, A B = .
3.3 PROBABILIDAD DE UN EVENTO
3.3.1 Definicin de probabilidad
La probabilidad de un evento es la razn entre el nmero de casos
favorables y el nmero total de casos posibles.

UCV Lima este

Pgina 72

Mtodos estadsticos

# de resultados favorables
DEFINICIN DE PROBABILIDAD

Probabilidad de un evento =

# de resultados posibles

CLSICA

PA

nA
n

3.3.2 Axioma de probabilidad


0 P(A) 1 Para cada evento A en
0
Sin probabilidad
De ocurrir

0.5
Tan probable
como improbable

1
Certeza
de ocurrir

P() = 1
Para cualquier numero finito k de eventos mutuamente excluyentes en ,
entonces
K K
P Ai PAi
i 1 i 1
3.4 TEOREMA
Si es el evento imposible, entonces P() = 0
Para cada evento A, se cumple que P(AC) = 1 P(A)
A y B son eventos tales que A esta dentro de B, entonces P(A) P(B)
Si A y B son dos eventos cualquiera en entonces

P A B P( A) P( B) P( A B)

Si A, B y C son tres eventos cualquiera en , entonces


P( A B C) P( A) P( B) P(C) P( A B) P( A C) P( B C) P( A B C)

Ejemplo
Consideremos el lanzamiento de
probabilidad de Obtener suma 7

un

dado dos

veces. Calcular

la

Ejemplo
Se tiene el siguiente experimento aleatorio

UCV Lima este

Pgina 73

Mtodos estadsticos

E: Lanzamiento de dos monedas al aire.


a) Calcule el espacio maestral
b) Sea el evento A: salga solo una cara. Plantee el evento A, utilizando conjunto
c) Cul es la probabilidad de que salga 1 cara?
Ejemplo
Hallar la probabilidad de sacar un Rey al extraer una carta de una baraja de 52
cartas
Ejemplo
Hallar la probabilidad de que en el lanzamiento de 3 monedas se obtenga resultados
iguales
Ejemplo
Si se tira 4 monedas, una despus de la otra.
Halle el espacio muestral.
Halle la probabilidad de que salgan 2 caras.
Halle la probabilidad de que al menos salgan 2 caras.
Halle la probabilidad de que a lo ms salgan 2 caras.
Ejemplo
Si se extraen dos cartas de un mazo. Hallar la probabilidad de que salgan 2
a) Con reemplazamiento
b) Sin reemplazamiento
4. PROBABILIDAD CONDICIONAL
La probabilidad condicional es una parte de las probabilidades que se ocupa del
anlisis de aquellos experimentos aleatorios que se ejecutan en ms de una etapa. Es
decir, la probabilidad condicional estudia la relacin de dos o ms eventos, de tal
manera que la probabilidad de ocurrencia de un evento depende de la ocurrencia o
no del otro.
4.1 Definicin de Probabilidad Condicional: Para dos eventos cualesquiera A y B
en un espacio muestra S, tales que P(A) > 0 con 0, P(A) la probabilidad del evento
B dado el evento A, se define por:

La definicin de probabilidad condicional satisface los siguientes axiomas:


a)
b)
c)
d)

P(A

UCV Lima este

Pgina 74

Mtodos estadsticos

EJEMPLO
Se lanzan dos dados. Si la suma ha sido 7, cul es la probabilidad de que alguno de
los dados haya salido un tres?
Sean los sucesos:
A= "la suma de los puntos es siete"
B = "en alguno de los dados ha salido un tres"
El suceso B /A es salir en algn dado 3, si la suma ha sido 7.
Observamos que esta situacin ocurre en las parejas (3 , 4) y (4 , 3) . Por tanto,
P (B / A) = 1 / 3
EJEMPLO
Se tiene la siguiente informacin:
Especialidad /
Sexo

Varones

Mujeres

Total

Ciencias

42%

28%

70%

Letras

12%

18%

30%

Total

54%

46%

100%

Se definen los siguientes eventos:


A : El estudiante elegido es de ciencias.
B : El estudiante elegido es varn.
Hallar:
a)
b)
Solucin:
a)
b)
5. PROBABILIDAD TOTAL
El Teorema de la probabilidad total nos permite calcular la probabilidad de un
suceso a partir de probabilidades condicionadas.
Antes de introducir la frmula pasaremos a explicar el concepto de Particin de un
conjunto.
Se llama particin a conjunto de sucesos Ai
A1 U A2 U... U An = S y Ai Aj =

UCV Lima este

(A 1 , A 2 , .. ., A n ) tales que

Pgina 75

Mtodos estadsticos

Sea A1, A2, ...,An un sistema completo de sucesos tales que la probabilidad de cada uno
de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las
probabilidades condicionales P(B/Ai), entonces la probabilidad del suceso B viene dada
por la expresin:

Ejemplo
Una compaa dedicada al transporte pblico explota tres lneas de una ciudad, de
forma que el 60% de los autobuses cubre el servicio de la primero lnea, el 30% cubre
la segunda y el 10% cubre el servicio de la tercera lnea. Se sabe que la probabilidad
de que, diariamente, un autobs se avere es del 2%, 4% y 1%, respectivamente, para
cada lnea. Determina la probabilidad de que, en un da, un autobs sufra una avera.

Solucin:

El suceso "sufrir una avera" (Av) puede producirse en las tres lneas, (L1, L2, L3). Segn
el teorema de la probabilidad total y teniendo en cuenta las probabilidades del
diagrama de rbol adjunto, tenemos:
P(Av) = P(L1) P(Av/L1) + P(L2) P(Av/L2) + P(L3) P(Av/L3) =
= 0.6 0.02 + 0.3 0.04 + 0.1 0.01 =
= 0.012 + 0.012 + 0.001 = 0.025

Ejemplo 22
Una empresa del ramo de la alimentacin elabora sus productos en cuatro factoras:
F1, F2, F3 y F4. El porcentaje de produccin total que se fabrica en cada factora es del
40%, 30%, 20% y 10%, respectivamente, y adems el porcentaje de envasado
incorrecto en cada factora es del 1%, 2%, 7% y 4%. Tomamos un producto de la
empresa al azar. Cul es la probabilidad de que se encuentre defectuosamente
envasado?
UCV Lima este

Pgina 76

Mtodos estadsticos

Solucin:

Llamando M = "el producto est defectuosamente envasado", se tiene que este


producto puede proceder de cada una de las cuatro factoras y, por tanto, segn el
teorema de la probabilidad total y teniendo en cuenta las probabilidades del diagrama
de rbol adjunto, tenemos:
P(M) = P(F1) P(M/F1) + P(F2) P(M/F2) + P(F3) P(M/F3) + P(F4) P(M/F4) =
= 0.4 0.01 + 0.3 0.02 + 0.2 0.07 + 0.1 0.04 =
= 0.004 + 0.006 + 0.014 + 0.004 = 0.028
6. TEOREMA DE BAYES
El Teorema de Bayes, dentro de la teora probabilstica, proporciona la
distribucin de probabilidad condicional de un evento "A" dado otro evento "B"
(probabilidad posteriori), en funcin de la distribucin de probabilidad condicional
del evento "B" dado "A" y de la distribucin de probabilidad marginal del evento "A"
(probabilidad simple o apriori).
Teorema:
Sea A1, A2, ...,An un sistema completo de sucesos, tales que la probabilidad de
cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen
las probabilidades condicionales P(B/Ai). Entonces la probabilidad P(Ai/B) viene dada
por la expresin:

Ejemplo
Tres mquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de
las piezas producidas en una fbrica. Los porcentajes de produccin defectuosa de
estas mquinas son del 3%, 4% y 5%.
Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de
haber sido producida por la mquina B.
Qu mquina tiene la mayor probabilidad de haber producido la citada pieza
defectuosa?

Solucin:

Sea D= "la pieza es defectuosa" y N= "la pieza no es defectuosa". La informacin del


problema puede expresarse en el diagrama de rbol adjunto.
a. Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D), por la
propiedad de la probabilidad total,
P(D) = P(A) P(D/A) + P(B) P(D/B) + P(C) P(D/C) =
= 0.45 0.03 + 0.30 0.04 + 0.25 0.05 = 0.038

UCV Lima este

Pgina 77

Mtodos estadsticos

b. Debemos calcular P(B/D). Por el teorema de Bayes,

c. Calculamos P(A/D) y P(C/D), comparndolas con el valor de P(B/D) ya calculado.


Aplicando el teorema de Bayes, obtenemos:

La mquina con mayor probabilidad de haber producido la pieza defectuosa es A.


6. EVENTOS INDEPENDIENTES
El concepto de independencia es importante porque facilita el anlisis de los
datos estadsticos. Si no se tuviese este concepto, el anlisis sera muy complejo y en
algunos casos imposible de llevarse a cabo.
Decimos que el par de eventos A,B son independientes s y solo s cualquiera
de las siguientes expresiones son verdaderas.
P(A\B) = P(A)
P(B\A) = P(B)
P(A

B) = P(A) . P(B)

UCV Lima este

Pgina 78

Mtodos estadsticos

EJERCICIOS PROPUESTOS

1- Cul es la probabilidad de obtener una cara o ms si lanzamos al aire una

moneda tres veces consecutivas? Cul la de obtener dos o ms caras?

2. Un experimento consiste en lanzar 4 monedas. Describa el espacio muestral


del experimento. Luego describa el rango de valores del numero de caras y
las veces que cada valor ocurre.
3. Una caja contiene 8 dulce de pia, 6 de naranjas y 4 de fresa. Cuntos
elementos tiene el espacio muestral que resulta de extraer al azar un dulce de
cada sabor?
4. De 8 hombres y 7 mujeres Cuntos comit de 10 miembros se puede formar
si cada uno de ellos debe contener cuando menos 5 mujeres?
5. En una universidad se realiza un estudio para determinar qu relacin existe, en
cado de haberla, entre la habilidad matemtica y el inters por las matemticas. Se
determinar la habilidad y el inters de 150 estudiantes, con los resultados
siguientes:

Habilidad
Escasa
Promedio
Mucho
TOTAL

Escaso
40
15
5
60

Inters
Promedio
8
17
10
35

Mucho
12
18
25
55

TOTAL
60
50
40
150

Si se escoge uno de los participantes en el estudio:

Cul es la probabilidad de escoger a una persona que tenga escaso


inters en las matemticas?

Cul es la probabilidad de seleccionar a una persona con habilidad


promedio?

Cul es la probabilidad de que una persona tenga mucha habilidad para


las matemticas dado que manifieste mucho inters por esa disciplina?
De que la persona tenga mucho inters en las matemticas dado que
posee una habilidad promedio?

UCV Lima este

Pgina 79

Mtodos estadsticos

6. Un grupo de personas estn distribuido de acuerdo a su gnero y lugar de


procedencia de la siguiente manera: 130 son hombres, 110 son de la capital y
30 son mujeres y de provincia. Si se eligen dos personas al azar de este grupo
calcule la probabilidad de que ambos sean hombres y de provincia.
7. Una urna contiene 20 fichas similares de las cuales 10 son rojas, 6 azules y
4 son verdes. Si se extraen 10 fichas al azar y a la vez calcule la probabilidad
de que ocurran cinco rojas y 3 azules.
8. Una caja contiene 16 pernos de los cuales 8 no tienen defecto, 5 tiene
defecto leves y 3 tiene defecto graves. Si se eligen 3 pernos al azar y de una
sola vez, calcule la probabilidad de que los tres pernos no tengan defecto leve.
9. Si en el control de calidad de la produccin de un articulo, la probabilidad de
que se encuentre por lo menos ocho artculos defectuoso es 0.15 y de que se
encuentren a lo ms 4 artculos defectuoso es 0.50, Cul es la probabilidad de
que se encuentre 5, 6, 7 artculos defectuoso en el control?
10. En una encuesta de opinin se encontr que el 25% de los electores votaran
por el candidato E. de lo que no votaran por E el 20% son mujeres. Adems,
7 de cada 10 electores son hombre. Si se elige un elector al azar y resulta
mujer, Cul es la probabilidad de que no vote por E?
11. De los 80 objetos que tienen un lote recibido por un comerciante, 2 de cada 5
son del proveedor A y el resto del proveedor B. adems, el 12.5% de
objetos de cada proveedor tiene fallas. Si se inspecciona cuatro objetos del lote
escogidos al azar a la vez, Cul es la probabilidad de que al menos uno tenga
falla si tres son del lote B?

UCV Lima este

Pgina 80

Mtodos estadsticos

DISTRIBUCIONES IMPORTANTES

1. DISTRIBUCIN NORMAL
Esta distribucin es frecuentemente utilizada
en las aplicaciones estadsticas. Su propio nombre
indica su extendida utilizacin, justificada por la
frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya
grfica tiene forma de campana.
Se dice que la variable aleatoria X es continua cuando toma valores reales
desde el
- < x< y se dice que se distribuye normalmente con media y
variancia 2 .
X ~ N (, 2)

La distribucin normal se utiliza como modelo para variables como el peso, la


altura, la calificacin en un examen, etc., es decir, en variables cuya distribucin es
simtrica respecto a un valor central (alrededor del cual toma valores con gran
probabilidad) y apenas aparecen valores extremos.
Si una variable aleatoria x tiene distribucin normal suele representarse como
N(, ) donde , es la media o valor esperado de la variable y = x es la desviacin
tpica de la variable, que son los dos parmetros que caracterizan la distribucin
normal.
2

En la distribucin normal, la mayora de la probabilidad se concentra en la


zona central.
UCV Lima este

Pgina 81

Mtodos estadsticos

1.1 Propiedades de la distribucin normal:


La distribucin normal posee ciertas propiedades importantes que conviene
destacar:
Tiene una nica moda, que coincide con su media y su mediana.
La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor
entre
y
es tericamente posible. El rea total bajo la curva es,
por tanto, igual a 1.
Es simtrica con respecto a su media.
La distancia entre la lnea trazada en la media y el punto de inflexin de
la curva es igual a una desviacin tpica.
El rea bajo la curva comprendida entre los valores situados
aproximadamente a dos desviaciones estndar de la media es igual a
0.95.
La forma de la campana de Gauss depende de los parmetros
.
1.2 Distribucin normal estndar
La distribucin normal estndar, o tipificada o reducida, es aquella que tiene
por media el valor cero, =0, y por desviacin tpica la unidad, =1.

La probabilidad de la variable X depender del rea del recinto sombreado


en la figura. Y para calcularla utilizaremos una tabla.
Tipificacin de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue
una distribucin N(, ) en otra variable Z que siga una distribucin N(0, 1).

Clculo de probabilidades en distribuciones normales


La tabla nos da las probabilidades de P(z k), siendo z la variable
tipificada. Estas probabilidades nos dan la funcin de distribucin (k).
(k) = P(z k)

UCV Lima este

Pgina 82

Mtodos estadsticos

Bsqueda en la tabla de valor de k: Unidades y dcimas en la columna de


la izquierda. Cntesimas en la fila de arriba.

P(Z a)

P(Z > a) = 1 - P( Z a)

P(Z a) = 1 P(Z a)

P(Z > a) = P(Z a)

UCV Lima este

Pgina 83

Mtodos estadsticos

P(a < Z b ) = P(Z b) P (Z a)

P(b < Z a ) = P(a < Z b )

Ejemplos.
1) Determinar la probabilidad de cada una de las siguientes expresiones:
a) P ( Z < 1.25 )
c) P (Z < 0 )
e) P ( -2.38 < Z < 0 )
g) P (1.55 < Z < 2.35)

b) P ( Z< -2.28)
d) P ( 0 < Z < 2.5 )
f) P ( - 2.25 < Z < 2.25 )
h ) P ( Z > 2.43 )

2) En una poblacin normalmente distribuida con media = 30 y variancia igual a


25 se pregunta: Qu porcentaje del total de las observaciones estarn entre 20 y
35?
3) Se sabe que el peso medio de la poblacin de un grupo de estudiantes es igual a 60
Kg., y su desviacin estndar es igual a 3 kg. Halle la probabilidad de que el peso
de un alumno este entre 55 y 65 kilogramos.
4) El peso de los atletas de pruebas de medio fondo sigue una distribucin normal
con media 64,3 kilos y desviacin tpica 2,3 kilos. Hallar un intervalo centrado
alrededor de la media que contenga:
a) l 68,3% de la poblacin
Solucin.-

b) El 95,5% de la poblacin
Solucin.-

c) El 99,7% de la poblacin
Solucin.UCV Lima este

Pgina 84

Mtodos estadsticos

Ejemplo
La longitud a que se puede estirar sin rotura un filamento de Nylon es una
variable aleatoria con media 5000 pies y desviacin estndar 5000. Cul es la
probabilidad que la longitud promedio de 100 filamento este comprendido entre
4750 y 5500?

UCV Lima este

Pgina 85

Mtodos estadsticos

2. DISTRIBUCIN T STUDENT
Sea Z una variable aleatoria normal con media 0 y varianza 1 sea, sea Y
una variable aleatoria que tiene una distribucin Chi - cuadrado con r grado de
libertad, y si Y e Z son independiente, entonces la variable aleatoria.

Z
Y /r

Se dice que tiene una distribucin t student, r grados de libertad.

PTr a p
r = grado de libertad
a = cuantil
p = probabilidad
Ejemplo a.
Hallar la probabilidad P (T5< 2,571) = p
Ejemplo b.
Hallar el grado de libertad P (Tr< 1,812) = 0,95
Ejemplo c.
Hallar el cuantil P (T8< a) = 0,95
2.1 TABLA DE LA DISTRIBUCIN t- Student
c t1, r
La tabla da reas 1
y valores
, donde, P[T c] 1 , y donde T
tiene distribucin t-Student con r grados de libertad.

UCV Lima este

Pgina 86

Mtodos estadsticos

1
r

0.75

0.80

0.85

0.90

0.95

0.975

0.99

0.995

1.000

1.376

1.963

3.078

6.314

12.706

31.821

63.657

0.816

1.061

1.386

1.886

2.920

4.303

6.965

9.925

0.765

0.978

1.250

1.638

2.353

3.182

4.541

5.841

0.741

0.941

1.190

1.533

2.132

2.776

3.747

4.604

0.727

0.920

1.156

1.476

2.015

2.571

3.365

4.032

0.718

0.906

1.134

1.440

1.943

2.447

3.143

3.707

0.711

0.896

1.119

1.415

1.895

2.365

2.998

3.499

0.706

0.889

1.108

1.397

1.860

2.306

2.896

3.355

0.703

0.883

1.100

1.383

1.833

2.262

2.821

3.250

10

0.700

0.879

1.093

1.372

1.812

2.228

2.764

3.169

11

0.697

0.876

1.088

1.363

1.796

2.201

2.718

3.106

12

0.695

0.873

1.083

1.356

1.782

2.179

2.681

3.055

13

0.694

0.870

1.079

1.350

1.771

2.160

2.650

3.012

14

0.692

0.868

1.076

1.345

1.761

2.145

2.624

2.977

15

0.691

0.866

1.074

1.341

1.753

2.131

2.602

2.947

16

0.690

0.865

1.071

1.337

1.746

2.120

2.583

2.921

17

0.689

0.863

1.069

1.333

1.740

2.110

2.567

2.898

18

0.688

0.862

1.067

1.330

1.734

2.101

2.552

2.878

19

0.688

0.861

1.066

1.328

1.729

2.093

2.539

2.861

20

0.687

0.860

1.064

1.325

1.725

2.086

2.528

2.845

21

0.686

0.859

1.063

1.323

1.721

2.080

2.518

2.831

22

0.686

0.858

1.061

1.321

1.717

2.074

2.508

2.819

23

0.685

0.858

1.060

1.319

1.714

2.069

2.500

2.807

24

0.685

0.857

1.059

1.318

1.711

2.064

2.492

2.797

25

0.684

0.856

1.058

1.316

1.708

2.060

2.485

2.787

26

0.684

0.856

1.058

1.315

1.706

2.056

2.479

2.779

27

0.684

0.855

1.057

1.314

1.703

2.052

2.473

2.771

28

0.683

0.855

1.056

1.313

1.701

2.048

2.467

2.763

29

0.683

0.854

1.055

1.311

1.699

2.045

2.462

2.756

30

0.683

0.854

1.055

1.310

1.697

2.042

2.457

2.750

40

0.681

0.851

1.050

1.303

1.684

2.021

2.423

2.704

60

0.679

0.848

1.046

1.296

1.671

2.000

2.390

2.660

120

0.677

0.845

1.041

1.289

1.658

1.980

2.358

2.617

0.674

0.842

1.036

1.282

1.645

1.960

2.326

2.576

UCV Lima este

Pgina 87

Mtodos estadsticos

2.1.1 DISTRIBUCIN CHI CUADRADO


Sean Z1, Z2, Zr, variables aleatorias independientes
normalmente, cada una con media 0 y varianza 1, la variable aleatoria
X 2 Z 12 Z 22 ......Z r2

distribuidas

Se dice que e una variable aleatoria Chi - cuadrado con r grado de libertad
P X2 a p

r = grado de libertad
a = cuantil
p = probabilidad
Ejemplo
Hallar la probabilidad P (x24< 2,19) = p
Ejemplo
Hallar el grado de libertad P (x2r< 18,3) = 0,95
Ejemplo
Hallar el cuantil P (x26< a) = 095

UCV Lima este

Pgina 88

Mtodos estadsticos

UCV Lima este

Pgina 89

Mtodos estadsticos

2.1.2 DISTRIBUCIN F DE FISHER


Considerando dos muestras aleatorias independientes, de tamao n1 y n2,
extradas de una poblacin normal, el estadstico F ser
DEFINICIN
Una variable F se define como el cociente entre dos variables ji-cuadrado
divididas por sus correspondientes grados de libertad.
CARACTERSTICAS
Una variable con distribucin F es siempre positiva.
La distribucin de la variable es asimtrica, pero su asimetra disminuye cuando
aumentan los grados de libertad del numerador y denominador.
Hay una distribucin F por cada par de grados de libertad.
Parmetros: Grados de libertad asociados al numerador y denominador

UCV Lima este

Pgina 90

Mtodos estadsticos

UCV Lima este

Pgina 91

Mtodos estadsticos

UCV Lima este

Pgina 92

Mtodos estadsticos

PROBLEMAS PROPUESTOS
1) El ingreso monetario mensual por hogar en una regin se distribuye segn
el modelo de la probabilidad normal con media 600 y desviacin estndar
100 dlares. Qu porcentaje de hogares de la regin tienen ingreso
menores de 400?
2) La demanda diaria, en kilogramos, de un producto se distribuye segn el
modelo de la probabilidad normal con una media de 50 y una desviacin
estndar de 10. Cul es la probabilidad de que la demanda de un da
cualquiera este entre los 46 y 54 kilogramos?
3) Los resultados de un examen de comportamiento agresivo aplicado a 400
adolescentes se distribuye segn el modelo de la probabilidad normal con
una media igual a 35 puntos. Obtenga la desviacin estndar de la
distribucin si el 84.13% de los adolescentes obtiene al menos 30 puntos.
4) El ingreso monetario mensual por hogar en una comunidad se distribuye
segn el modelo de la probabilidad normal con una media de 400 y una
desviacin estndar de 50. todos los hogares que estn en el dcimo superior
de los ingreso mensuales pagan una contribucin de solidaridad, a partir de
que ingreso lo hacen?
5) Una pieza es considerada defectuosa y por lo tanto rechazada si su
dimetro es mayor que 2.02 cm. O es menor que 1.98 cm. Suponga que
los dimetros tienen distribucin normal con media de 2 cm. Y desviacin
estndar de 0.01 cm. Cuntas piezas de 10000 se espera que sean
rechazadas?
6) Los pesos de los posible usuarios de un ascensor constituye una poblacin
cuya distribucin normal con una media de 70 Kg. y una desviacin estndar
de 10 Kg. si el ascensor admite como peso mximo 585 kg. Cul es la
probabilidad que el peso total de 10 usuarios supere ese peso mximo?
7) El tiempo, en minuto que demora un operario en ensamblar un objetos es
una variable aleatoria X cuya distribucin tiene una media de 30 y una
desviacin estndar de 2. el objeto totalmente terminado requiere un
tiempo de x + 5 minutos. Si el operario tiene que entregar 36 objetos
totalmente terminado, calcule la probabilidad de que emplee un tiempo total
de al menos 20.5 horas.
8) Las llamadas que realiza un alumno por su telfono celular duran en
promedio tres minutos con una desviacin estndar de 0.05 minutos. Si el
costo por llamada tiene un valor fijo de 0.8 dlares ms un costo variable

UCV Lima este

Pgina 93

Mtodos estadsticos

de 0.5 dlares por minuto, calcule la probabilidad de que el costo total de


36 llamadas sea mayor de 85 dlares.
9) Un supermercado produce pan especial cuyo peso X debe tener una media
de 100 gramos y una desviacin estndar de 5 gramos. Si el pan tiene ms
de 100 gramos, la diferencia del peso por cada pan tiene un costo en soles
dados por: c = 0.0125x -1.00. Si se produce 200 panes por turno Cul es
la probabilidad de que el costo total por la diferencia supere los 48
dlares?
10) La duracin en meses de los focos que produce una compaa se distribuye
segn el modelo de la probabilidad normal. Si el 18.41% de estos focos
duran menos de 8.2 meses y el 6.68% duran al menos 13 meses. Calcule
la media y la varianza de la duracin de los focos.

UCV Lima este

Pgina 94

Mtodos estadsticos

TEORA DE MUESTREO

1. ESTADSTICA
Es la ciencia que se ocupa
de los mtodos y procedimientos
para recoger, clasificar, resumir, y
analizar datos, siempre y cuando
la variabilidad e incertidumbre sea
una causa de los mismos; as como
de realizar inferencias a partir de
ellos, con la finalidad de ayudar a
la toma de decisiones y en su caso
formular predicciones.
1.1 ESTADSTICA DESCRIPTIVA
Es el conjunto de mtodos estadsticos que se relacionan con el resumen
y descripcin de los datos, como tablas, graficas y el anlisis mediante algunos
clculos.
1.2 INFERENCIA ESTADSTICA
Es el conjunto de mtodos con lo cual se hace la generalizacin sobre
una poblacin utilizando una muestra. La inferencia puede contener conclusiones
que pueden no ser ciertas en forma absoluta, por lo que es necesario que
estas sean dadas con una medida de confiabilidad, el cual se le conoce como
probabilidad.
1.3 POBLACIN
Es el conjunto de elementos que contienen una o ms caracterstica
observable de naturaleza cualitativa o cuantitativa que se pueden medir en
ellos.
a. UNIDAD ELEMENTAL
Viene a ser cada elemento de la poblacin.
b. UNIDAD DE ANLISIS
Elemento del que hay que obtener la informacin.

UCV Lima este

Pgina 95

Mtodos estadsticos

1.4 VARIABLE
Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms
valores o modalidades.
1.5 DATO
Es el resultado de medir una caracterstica observable de una unidad de
anlisis.
1.6 INFORMACIN
Es el resultado que se obtiene al procesar un conjunto de datos.
1.7 PARMETRO
Se denomina parmetro a una medida descriptiva que resume una
caracterstica, calculada a partir de los datos observados en toda la poblacin.
1.8 MUESTRA
Se denomina muestra a una parte de la poblacin seleccionada de acuerdo
con un plan o regla, con el fin de obtener informacin acerca de la poblacin
de la cual proviene.
1.9 ESTADGRAFO
Se denomina estadgrafo a una medida descriptiva que resume una
caracterstica, calculada a partir de los datos observados en una muestra
aleatoria.
1.10 ERROR DE ESTIMACIN
Es la diferencia entre un estadstico y su parmetro correspondiente. Es una
medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor
de la poblacin, nos da una nocin clara hasta dnde y con qu probabilidad una
estimacin basada en una muestra se aleja del valor que se hubiera obtenido por
medio de un censo completo. Siempre se comete un error, pero la naturaleza de la
investigacin nos indicar hasta qu medida podemos cometerlo.
1.11 MUESTREO
Evaluar el comportamiento de una o varias caractersticas o variables de una
poblacin sera muy costoso, por lo que la estadstica nos brinda procedimientos para
seleccionar a una parte de esa poblacin y analizarla de tal forma que sus
caractersticas coincidan con la poblacin. El muestreo es la seleccin de una parte
representativa de la poblacin que permita estimar los parmetros de la poblacin.
UCV Lima este

Pgina 96

Mtodos estadsticos

1.11.1 VENTAJAS DEL EMPLEO DE MUESTRAS


Hay muchas razones por las cuales el estudio de una muestra es preferible al de
la totalidad de la poblacin. Ante todo, es evidente que el estudio de muestras es el
nico practicable cuando se trata de poblaciones infinitas o de poblaciones limitadas
pero muy extensas, pues ningn investigador sera capaz de estudiarlo en su totalidad.
Lo mismo es valedero para aquellas investigaciones en las cuales el proceso de
investigacin destruye al individuo que se estudia, como en el caso en que se prueba la
accin de ciertos venenos en animales de experimentacin.
Pero an en el caso en que se quiera estudiar una poblaci6n perfectamente
limitada, debemos decidirnos por la muestra, pues su utilizaci6n tiene las siguientes
ventajas:

Ahorra tiempo, dinero y trabajo.

Permite una mayor exactitud en el estudio, pues los errores debidos al


observador, al objeto observado y al mtodo de observacin, pueden
disminuir y controlarse ms efectivamente.

En efecto, como ser menor el nmero de personas que intervengan en el


estudio, ser mucho ms fcil conseguir buenos especialistas y entrenarlos
uniformemente; como se necesitarn menos instrumentos de investigacin, stos
podrn vigilarse y calibrarse ms cuidadosamente.
1.11.2 DESVENTAJAS DEL EMPLEO DE MUESTRAS
La nica desventaja del uso de muestras es el llamado error de muestreo, el cual
sumado a los tres tipos de error antes mencionado, podra invalidar nuestro estudio.
Este error de muestreo es una consecuencia de la variabilidad de las poblaciones.
Como los individuos de una poblacin son muy variables, los diferentes grupos
o muestras que podemos formar con ellas diferirn tambin unas de otras y como
nosotros estudiamos una muestra para generalizar luego a toda la poblacin, los
resultados sern algo distintos segn la muestra que hayamos escogido. Esta diferencia
entre el valor dado por la muestra y el verdadero valor de la poblacin, constituye el
error por muestreo.
Ejemplo:
Supongamos que una poblacin de 4 personas tienen un capital de S/. 5 000, S/.
7 000, S/. 6 000 y S/. 10 000 soles respectivamente.
El capital promedio de esta poblacin es

5,000 7,000 6,000 10,000


= S/. 7 000
4

Si no se conociera dicho promedio y para averiguarlo se tomara una muestra


de dos personas, digamos los 2 primeros (5 000, 7 000), concluiramos que el capital
promedio de cada persona de la poblacin es S/. 6,000, cuando en realidad vemos
UCV Lima este

Pgina 97

Mtodos estadsticos

que fue S/. 7 000, esta diferencia de S/. 1 000 entre el valor de la muestra y el valor
de la poblacin constituye el error por muestreo.
La presencia del error por muestreo parecera indicar que el estudiar una
muestra en vez de la poblacin, es desfavorable y no ventajosa como hemos indicado.
Sin embargo, conviene tener presente:
- En primer lugar, que el error por muestreo suele ser mucho menos importante que
los errores debidos al observador, al mtodo de observacin y a los individuos
estudiados, y -en segundo lugar, que el error por muestreo puede medirse
estadsticamente y en cierto modo, puede disminuirse a voluntad, tan solo con
aumentar el tamao de la muestra.
1.11.3 USOS DEL MUESTREO
El Muestreo es utilizado en diversos campos:
a. Poltica: Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
b. Educacin: Las muestras de las calificaciones de los exmenes de estudiantes se
usan para determinar la eficiencia de una tcnica o programa de enseanza.
c. Industria: La muestras de los productos de una lnea de ensamble sirve para
controlar la calidad.
d. Medicina: Las muestras de medidas de azcar en la sangre de pacientes diabticos
prueban la eficacia de una tcnica o de un frmaco nuevo.
e. Agricultura: Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
f. Gobierno: Una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
1.11.4 TABLA DE NMEROS ALEATORIOS
Las Tablas de Nmeros Aleatorios contienen los dgitos 0, 1, 2,..., 7, 8, 9. Tales
dgitos se pueden leer individualmente o en grupos y en cualquier orden, en columnas
hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible
considerarlos como aleatorios.
Las tablas se caracterizan por dos cosas que las hacen particularmente tiles para
el muestreo al azar. Una caracterstica es que los dgitos estn ordenados de tal manera
que la probabilidad de que aparezca cualquiera en un punto dado de una secuencia es
igual a la probabilidad de que ocurra cualquier otro. La otra es que las combinaciones
de dgitos tienen la misma probabilidad de ocurrir que las otras combinaciones de un
UCV Lima este

Pgina 98

Mtodos estadsticos

nmero igual de dgitos. Estas dos condiciones satisfacen los requisitos necesarios para
el muestreo aleatorio, establecidos anteriormente
Existen mtodos ms eficaces para generar nmeros aleatorios, en muchos de
los cuales se utilizan calculadoras u otra clase de aparatos electrnicos. Las tablas
elaboradas mediante estos mtodos son verificadas completamente para asegurarse de
que en realidad sean aleatorias. Sin embargo, el inters no radica en elaborar estas
tablas, sino utilizarlas.
Para utilizar una Tabla de Nmeros Aleatorios:
Hacer una lista de los elementos de la poblacin.
Numerar consecutivamente los elementos de la lista, empezando con el cero
Tomar los nmeros de una Tabla de Nmeros Aleatorios, de manera que la cantidad
de dgitos de cada uno sea igual a la del ltimo elemento numerado de su lista. De
ese modo, si el ltimo nmero fue 18, 56 72, se deber tomar un nmero de dos
dgitos.
Omitir cualquier nmero que no corresponda con los nmeros de la lista o que
repita cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el
nmero de observaciones deseado.
Utilizar dichos nmeros aleatorios para identificar los elementos de la lista que se
habrn de incluir en la muestra.
Donald B. Owen, Handbook of Statistical Tables, Reading
Mass:Addisson-Wesley, 1.962
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9002
0772 2160 7236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6466 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
0092 1629 0377 3590 2209 4839 6332 1490 3092
0935 5565 2315 8030 7651 5189 0075 9353 1921
UCV Lima este

Pgina 99

Mtodos estadsticos

2605 3973 8204 4143 2677 0034 8601 3340 8383


7277 9889 0390 5579 4620 5650 0210 2082 4664
5484 3900 3485 0741 9069 5920 4326 7704 6525
6905 7127 5933 1137 7583 6450 5658 7678 3444
8387 5323 3753 1859 6043 0294 5110 6340 9137
4094 4957 0163 9717 4118 4276 9465 8820 4127
4951 3781 5101 1815 7068 6379 7252 1086 8919
9047 0199 5068 7447 1664 9278 1708 3625 2864
7274 9512 0074 6677 8676 0222 3335 1976 1645
9192 4011 0255 5458 6942 8043 6201 1587 0972
0554 1690 6333 1931 9433 2661 8690 2313 6999
9231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617
2402 6250 9362 7373 4757 1716 1942 0417 5921
5295 7385 5474 2123 7035 9983 5192 1840 6176
5177 1191 2106 3351 5057 0967 4538 1246 3374
7315 3365 7203 1231 0546 6612 1038 1425 2709
5775 7517 8974 3961 2183 5295 3096 8536 9442
5500 2276 6307 2346 1285 7000 5306 0414 3383
3251 8902 8843 2112 8567 8131 8116 5270 5994
4675 5 2192 0874 2897 0262 5092 5541 4014

1.11.5 DETERMINACIN DEL TAMAO DE LA MUESTRA

NZ 2 P(1 P)
( N 1) E 2 Z 2 P(1 P)

UCV Lima este

NZ 2
( N 1) E 2 Z 2

PARA LA PROPORCIN
PARA LA MEDIA

Pgina 100

Mtodos estadsticos

a. Mtodos de muestreo probabilsticos:


a.1 Muestreo aleatorio simple: Es la forma ms comn de obtener una muestra en
la seleccin al azar, es decir, cada uno de los individuos de una poblacin tiene la
misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra
es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe
emplearse para su constitucin una tabla de nmeros aleatorios.
Ejemplo
Se tiene una poblacin de 200 personas, determinar si se trabaja con toda la
poblacin o muestra; y si se trabaja con una muestra determinar el tamao y
escoger la muestra.
a.2 Muestreo aleatorio sistemtico: Es una tcnica de muestreo que requiere de
una seleccin aleatoria inicial de observaciones seguida de otra seleccin de
observaciones obtenida usando algn sistema o regla.
Ejemplo
Se tiene una poblacin de 400 personas, determinar si se trabaja con toda la
poblacin o muestra; y si se trabaja con una muestra determinar el tamao
escoger la muestra por muestro aleatorio sistemtico.
a.3 Muestreo aleatorio estratificado: Una muestra es estratificada cuando los
elementos de la muestra son proporcionales a su presencia en la poblacin. La
presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de
muestreo, se divide a la poblacin en varios grupos o estratos con el fin de dar
representatividad a los distintos factores que integran el universo de estudio. Para la
seleccin de los elementos o unidades representantes, se utiliza el mtodo de muestreo
aleatorio.
En sntesis, requiere de separar a la poblacin segn grupos llamados estratos,
y de elegir despus una muestra aleatoria simple en cada estrato. La informacin de las
muestras aleatorias simples de cada estrato constituira entonces una muestra global.
Ejemplo
Para realizar un control de calidad para determinar en qu estado viene la caa se
realiza un muestreo aleatorio simple, puesto que la caa puede provenir de tres tipos
de proveedores.
Proveedor tipo A (estrato 1) la caa proviene de lotes de la misma finca.
Proveedor tipo B (estrato 2) la caa proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la caa proviene de fincas de particulares en donde el
ingenio no ha tenido ningn servicio.

UCV Lima este

Pgina 101

Mtodos estadsticos

DATOS:
ESTRATO

Ni

560

190

250

a.4 Muestreo aleatorio por rea o conglomerado: Requiere de elegir una muestra
aleatoria simple de unidades heterogneas entre s de la poblacin llamadas
conglomerados. Cada elemento de la poblacin pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente
heterogneos o dismiles. Ejemplo:
En el muestreo por conglomerados, stos se forman para representar, tan
fielmente como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria
simple de conglomerados para estudiarla. Los estudios de instituciones sociales como
iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el
muestreo por conglomerados.
Ejemplo
Para un estudio que se realiza en un AA.HH el cual est formado por 20 manzanas
escoger una muestra mediante muestreo aleatorio simple.

NMERO
MANZANA

NMERO
DE LOTE

NMERO
MANZANA

NMERO
DE LOTE

NMERO
MANZANA

NMERO
DE LOTE

NMERO
MANZANA

NMERO
DE LOTE

20

10

11

25

16

20

25

25

12

20

17

20

30

20

13

30

18

25

10

30

14

10

19

30

15

10

40

15

15

20

10

b. Mtodos de muestreo no probabilsticos:


b.1 Muestreo accidental.- Es un muestreo no probabilstica donde el investigador
elige a aquellos individuos que estn a mano. Por ejemplo, un periodista que va por la
calle preguntando a las personas que salen a su paso, sin atender ningn criterio
especial de eleccin. No es probabilstica porque aquellas personas que no pasan por
ese sitio no tienen la posibilidad de entrar en la muestra.
UCV Lima este

Pgina 102

Mtodos estadsticos

b.2 Muestreo por cuotas.- Se aplica en la ltima fase del muestreo, y consiste en
facilitar al entrevistador el perfil de las personas que tiene que entrevistar dejando su
criterio, la eleccin de las mismas, siempre y cuando cumplan con el perfil.
b.3 Muestreo intencionado.- Se basa en una buena estrategia y el buen juicio del
investigador. Se puede elegir las unidades del muestreo. Un caso frecuente es tomar
elementos que se juzgan tpicos o representativos de la poblacin, y suponer que los
errores en la seleccin se compensarn unos con otros. El problema que plantea es que
sin una comprobacin de otro tipo, no es posible saber si los casos tpicos lo son en
realidad, y tampoco se conoce como afecta a esos casos tpicos los posibles cambios
que se producen.

UCV Lima este

Pgina 103

Mtodos estadsticos

PROBLEMAS PROPUESTOS
1. Una cantidad, con frecuencia, de inters para una clnica es el porcentaje de
pacientes retrasados para su vacunacin. Algunas clnicas examinan cada registro
para determinar el porcentaje; Sin embargo, en una clnica grande, la realizacin
de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realiz una
muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland
para estimar la proporcin de inters. Qu tamao de muestra sera necesario con
una muestra aleatoria simple (sin reemplazo) para estimar la proporcin con el
95% de confianza y un margen de error de 0.10.
2. En un estudio, se desea determinar en qu proporcin los nios de una regin
toman incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos
tener una precisin del 10 por ciento, con un nivel de significancia del 5%. De
qu tamao debe de ser la muestra?
3. En un lote de frascos para medicina, con una poblacin de 8000 unidades, se
desea estimar la media de la capacidad en centmetros cbicos de los mismos. A
travs de un pre muestreo de tamao 35 se ha estimado que la desviacin
estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3,
y un nivel de significancia del 5%. De qu tamao debe de ser la muestra?
4. Existe tres colegios de los cuales se quiere extraer una muestra, los colegio
estas categorizado segn estrato socio econmico; del colegia A tiene 520
alumnos, el colegio B tiene 450 alumnos y el colegio C tiene 950 alumnos;
determinar cuntos alumnos de cada colegio se tiene que escoger
5. La captura de eglefino de un barco de arrastre se desembarca en Aberdeen
dividida en cuatro categoras de tamaos, que sern los cuatro estratos (datos
tomados de Pope, 1956). Se hicieron muestras de cada categora, y los resultados
se pueden resumir del modo siguiente:

Categora

UCV Lima este

Ni

Pequeo

2 432

Pequeo-Mediano

1 656

Mediano

2 268

Grande

665

TOTAL

7 021

Pgina 104

Mtodos estadsticos

6. El presidente de una fraternidad en el campus universitario desea tomar una


muestra de las opiniones de 112 miembros respecto a las actividades urgentes para
el otoo.
a. cul es la poblacin?
_________________________________________________________
b. Cul es la mejor forma en qu debe tomarse la muestra?
_________________________________________________________
7. Se desea realizar una evaluacin de los principales problemas detectados en el
campus universitario:
i. congestionamiento en los ascensores
ii. prdida de objetos personales
iii.
rendimiento de los alumnos.
iv.
Vocacin profesional.
Identifique la poblacin y el tipo de muestreo que aplicara. Por qu?
cada caso.

Responda en

i)

Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
____________________________________________________________

ii)

Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________

iii)

Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________

iv)

8. El censo del 2007 se muestra que en Jauja el 11.5% de los residentes tienen ms de
60 aos. Para verificar un sistema de muestreo por telfono se llaman a 200
residencias elegidas al azar. De los residentes contactados, 10.2% tenan ms de 60
aos.
a) 11.5% es un parmetro o una estadstica?
b) 10.2% es un parmetro o una estadstica?

UCV Lima este

Pgina 105

Mtodos estadsticos

9. En el ao 2006 la Universidad Cesar Vallejo tiene 5 453 estudiantes, en la tabla se


muestra un detalle de la composicin. Necesitamos una muestra de tamao n=20
de la poblacin de estudiantes.
Mujeres
2461
67
2528

Pregrado
Postgrado
Total

Hombres
2848
77
2925

Total
5309
144
5453

Elija muestras de tamao 20 para 2 tipos de muestreo:


a) Muestreo aleatorio simple
b) Muestreo estratificado
10. Supongamos que necesitamos seleccionar a 4 integrantes del programa de
televisin "Gana con la Estadstica" de Abril del 2008. Calcule muestras de tamao
n=4 usando los distintos diseos muestrales (muestreo aleatorio simple y
muestreo estratificado). En cada alternativa, use la tabla de nmeros aleatorios,
empiece en la fila 3 columna 3.

Mujeres

Hombres

Giovanna Santos

Carolina Soto

Jorge Molina

Gianina Ramos

Maura Rivera

Nelson Pachas

Brbara Ascue

Mara Sobarzo

Leandro Martnez

Pam Lozano

Rosa Daz

Joel Mauri

Jimena Pereira

Daro Jurez

La Gutirrez

Dany Bellido

11. Suponga que nuestra poblacin de inters es el comit de estudiantes de la UCV


para efectos de colaboracin con la universidad en agosto del 2008. Juan Prez,
Miguel Cornejo, Juana Olivares, Lucia Galn, Edwin Manrique, Anglica Mario,
Carlos Enciso, Julia Salinas, Manuela Enrico, Sonia Oquendo, ngel Bravo, Luis
Alba, Abel Vivar, Carla Espinosa, Marcelo Oyarte, Elba Aguilar, Ernesto Aguirre,
Francisco Alama.
a) Si nos interesa estudiar la proporcin de mujeres en esta poblacin. Elija una
muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Indique cul es el parmetro y el estadstico en (a)
c) Elija una muestra estratificada por sexo de tamao n=4 de esta poblacin

UCV Lima este

Pgina 106

Mtodos estadsticos

12. La Facultad de Administracin de la Universidad Cesar Vallejo, quiere saber acerca


del ingreso promedio de sus estudiantes y para esto enva cartas a todos los
Estudiantes desde su ingreso a la Universidad en el ao 2006. En la Encuesta haba
slo una pregunta: Cul es el ingreso promedio en su hogar? Aproximadamente
30% de los alumnos respondieron.
Comente los posibles sesgos acerca del salario promedio de los estudiantes de
Administracin. Cmo debe ser el ingreso promedio entre los que respondieron y
los que no respondieron?
13. El titular de un diario dice: Encuesta seala que aument el porcentaje de gente
que chatea en el trabajo. El artculo dio la siguiente informacin: Se encuestaron
al azar 227 personas que llamaron a la lnea abierta 800-CHAT durante 6 semanas
entre Febrero y Marzo. 92% de los que llamaron dijeron haber chateado alguna
vez mientras trabajaban.
a) Qu clase de muestreo se us?
b) Cul piensa usted que fue la poblacin de la cual fue elegida esta muestra?
c) Piensa usted que el titular es correcto?
14. Una organizacin estudiantil quiere saber si a los estudiantes le interesa cambiar el
horario de atencin de la biblioteca. Selecciona al azar 100 estudiantes de primer
ao, 100 de segundo, y 100 estudiantes que egresarn este ao. Qu tipo de
diseo muestral es ste?
15. Un profesor quiere investigar sobre el tiempo diario de estudio de 20 estudiantes
de una clase.

Nombre

Nmero de
horas

Nombre

Nmero de
horas

Juan

2,3

Mara

2,9

Alicia

1,9

Fernanda

0,7

Pedro

2,0

Julio

0,8

Marcos

1,5

Rosa

1,0

Alberto

1,7

Fabin

1,3

Jorge

2,2

Ana

2,8

Jos

1,8

Laura

0,8

Carlos

1,9

Enrique

0,9

Miguel

1,9

Carmen

1,1

Victoria

1,6

Marcelo

1,2

UCV Lima este

Pgina 107

Mtodos estadsticos

En cada alternativa, use la tabla de nmeros aleatorios, empiece en la fila 1 columna


1 y contine seleccionando hacia la derecha.
a) Elija una muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Calcule el Parmetro y el Estadstico en (a).
c) Elija una muestra estratificada de tamao n=4 de esta poblacin
d) Calcule el estadstico en (c)
16. Una compaa de marketing saca una muestra de la gua de telfonos tomando
10 personas cuyos apellidos comiencen con letra A, 10 personas cuyos apellidos
comiencen con la letra B, y as sucesivamente con cada letra del alfabeto, para una
muestra total de 260 personas.
a) Qu clase de diseo muestral se us aqu?
b) Tienen todos los que estn en la gua de telfonos igual probabilidad de ser
elegidos en la muestra?
c) No todos los residentes de la ciudad tiene telfono, qu clase de sesgo va a
provocar este hecho?
d) Se sabe que la distribucin de la primera letra del apellido vara por etnicidad
Qu clase de sesgo va a provocar este hecho?

UCV Lima este

Pgina 108

Mtodos estadsticos

ESTIMACIN DE PARMETRO

1. INTRODUCCIN
Al realizar una investigacin estadstica a
menudo se sabe o se supone que la poblacin
definida por una variable aleatoria x, de la cual se
selecciona una muestra aleatoria, tiene una forma
funcional especifica cuyo parmetro se intenta
determinar.
Los
mtodo
de
inferencia
estadstica,
bsicamente, consisten en seleccionar una muestra
aleatoria de la poblacin en estudio y con la informacin que se obtenga de esta
llegar a estimar el o los valores del parmetro desconocido.
El mtodo de estimacin de parmetro puede ser puntual o por intervalos, en el
primer caso, la estimacin del parmetro es un numero. Mientras que en el
segundo caso la estimaron del parmetro es un intervalo de los posible valores
que puede tener.
2. ESTIMACIN PUNTUAL
La estimacin puntual es el valor numrico de un estimador, un buen
estimador es aquel que se acerca al verdadero valor del parmetro.
Ejemplo: De una poblacin de 120 sueldos de Profesores de la Universidad X, se toma
una muestra de 40 sueldos, y se calcula el sueldo promedio. Supongamos que el
sueldo promedio es: S/. 690.00 soles, y al momento de concluir el trabajo podemos
decir, que el sueldo promedio de los profesores de la universidad X, tienen un sueldo
promedio de S/. 690.00. Quiere decir que el promedio poblacional , se ha estimado
puntualmente por x = S/. 690.00 soles.
3. INTERVALO DE CONFIANZA
La estimacin por intervalo es la estimacin del parmetro dentro de un
intervalo de extremo cerrado [a, b], donde los nmeros a y b se obtiene a partir
de la distribucin de la estadstica que estima puntualmente el parmetro y a
partir de los valores de la muestra.
Sea X1, X2..Xn una muestra aleatoria de tamao n escogida de una poblacin f(x,
), cuyo valores experimentales respectivos son x1, x2..xn , sea adems, la
__

expresin

H(X , X
1

2 ,...X n )

es una estadstica para estimar el parmetro cuya


__

distribucin de probabilidad sea conocida y sea


UCV Lima este

el valor del parmetro, dado el


Pgina 109

Mtodos estadsticos

nmero 1 , y si a partir de la distribucin de probabilidad del estimador se


puede encontrar el estimador A y B tales que:
PA B 1
se dice entonces que el intervalo A, B es el intervalo del estimador de parmetro
con el grado de confianza de 1 *100%, o que tal intervalo contiene al
parmetro con probabilidad 1
Un nivel de confianza del 95%, implica que 95% de todas las muestras incluye al
parmetro y solo un 5% de las muestras producir un intervalo errneo. Cuanto
mayor es el nivel de confianza se estima que el valor del parmetro este dentro del
intervalo.
Ejemplo. El sueldo promedio de los profesores en la Universidad X, se encuentran
entre S/. 650.00 y S./ 720.00 soles
4. INTERVALO PARA LA MEDIA POBLACIONAL
Sabemos que:

Pero tambin,

X-

Como no conocemos el parmetro y lo queremos estimar por medio de la


media de la muestra, slo se despejar de la formula anterior, quedando lo
siguiente:

X 1-/2

De esta frmula se puede observar que tanto el tamao de la muestra como el


valor de Z se conocern. Z se puede obtener de la tabla de la distribucin normal a
partir del nivel de confianza establecido. Pero en ocasiones la muestra es menor de 30
o se desconoce por lo que en esos casos lo correcto es utilizar otra distribucin
llamada "t" de Student si la poblacin de donde provienen los datos es normal.

X t (n - 1;1- /2)

s
n

Donde S la desviacin estndar de la muestra y t es la distribucin de la t de


Student con n 1 grados de libertad y nivel de confianza igual a 1 - /2 .
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual
de la desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de
la poblacin (s= ).
UCV Lima este

Pgina 110

Mtodos estadsticos

El error de estimacin
despejando:

de ser la diferencia absoluta entre x y , es decir

Error de estimacin de =

- X 1-/2

Ejemplo:
Se encuentra que en una dieta la concentracin promedio de vitaminas a partir de una
muestra de 36 mediciones en sitios diferentes del hospital es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la concentracin de vitaminas es 0.3.
a) Seale la estimacin puntual para .
b) Encuentre el intervalo de confianza al 95% para la concentracin
media de vitaminas en las dietas de dicho hospital.
c) Halle el error de estimacin de para la pregunta b.
d) Encuentre el intervalo de confianza al 99% para la concentracin media
de vitaminas en las dietas de dicho hospital.
e) Halle el error de estimacin de para la pregunta d.
Solucin:
a) La estimacin puntual para es:
X
, es decir = 2.6 gr/ml
b) IC para la media poblacional se calcula:

X 1- /2

Reemplazando valores:
c) El error de estimacin de para la pregunta b.
d) Calculando el Intervalo de confianza para la media a un nivel de confianza
del 99%
e) Calcule el error de estimacin de
Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra
de 32 focos tiene una duracin promedio de 780 horas, encuentre un intervalo de
confianza de 96% para la media de la poblacin de todos los focos que produce esta
empresa as tambin halle el error de estimacin.
Solucin:
X 1- /2

UCV Lima este

Pgina 111

Mtodos estadsticos

Ejemplo
Una muestra aleatoria de 100 hogares de una ciudad, revela que el promedio de los
ingresos mensuales es de 500 dlares. Obtenga un intervalo de confianza del 95%
para la media de la poblacin de los ingresos de todos los hogares de esa ciudad.
Asuma que la desviacin estndar poblacional es 100.
Ejemplo
Para confirmar el peso neto promedio de los frascos de conserva de palmito de la
empresa agroindustrial LA PALMA de Iquitos, cuya especificacin es de 250
gramos, un estudiante de estadstica aplicada selecciono una muestra de tamao 10
de tales frascos y observo los siguiente peso netos en gramos: 250
251 249
248 256 252 248 256 256 254
Construya un intervalo de confianza del 96%
Ejemplo
Una muestra de 60 nias de diez aos de edad proporciono un peso medio
de 40 Kg. y una desviacin estndar de 4 Kg., respectivamente. Suponiendo
que existe normalidad, encuentre los intervalos de confianza del 95% para la
media poblacional

5. INTERVALO PARA LA PROPORCIN: P


Una proporcin es una razn de una parte con respecto a un todo y que
generalmente pertenecen a un experimento aleatorio de tipo binomial, es decir con
solo dos posibles respuestas.
Sabemos que:

P p
pq
n

Como no conocemos el parmetro p y lo queremos estimar por medio de la


proporcin de la muestra, slo se despejar P de la formula anterior, quedando lo
siguiente:

P p 1 / 2

pq
n

Error de estimacin de P
P p= 1 / 2

pq
n

Ejemplo
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de
discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms
UCV Lima este

Pgina 112

Mtodos estadsticos

pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los


reproductores de discos compactos de la poblacin que no pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos
que no pasan la prueba en esa poblacin est entre:
En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de
confianza para aproximar la proporcin de todos los accidentes automovilsticos que
en esa ciudad tienen consecuencias fatales.
Solucin:
P= 60/300 = 0.20
Z(0.90) = 1.645
Ejemplo
En instituto de opinin publica utilizo una muestra aleatoria de 600 lectores que
acaban de emitir su voto, para realizar un proyeccin estadstica de los resultados.
Si el sondeo indica que 240 electores votaron a favor del candidato A, obtenga el
intervalo de estimacin del porcentaje de electores a favor A en toda la poblacin
con el nivel de confianza del 95%.
6. INTERVALO PARA LA VARIANZA

LI

(n 1) s 2

1 ; n 1
2

LS

(n 1) s 2
2

; n 1

Ejemplo
Para estimar la variabilidad de los contenidos de un producto que una empresa
comercializa en bolsa de 150 gramos. Un analista de mtodos cuantitativos
escogi una muestra aleatoria de 10 unidades del producto resultando los
siguiente pesos en gramos:
150,5 150.7 148.1 150.4 149.3 151.2 150.9 149.2 150.3 149.3
Obtenga el intervalo de confianza del 95% para la varianza de los contenidos de
todas las unidades del producto en mencin. Supngase que la poblacin de estos
contenidos se distribuye segn el modelo de la probabilidad normal.
UCV Lima este

Pgina 113

Mtodos estadsticos

PROBLEMAS PROPUESTOS

1) El tiempo en minuto que utiliza los clientes en sus distintas operaciones en


un banco local es una variable aleatoria cuya distribucin se supone normal
con una desviacin estndar de 3 minuto. Se han registrado los tiempos de
las operaciones de 9 clientes del banco resultando una media igual a 9
minuto, Cunto es el nivel de confianza si la media poblacional se estima de
7 a 11?
2) Se asigna una tarea estadstica a un grupo de estudiantes para hacer un
estudio del contenido promedio de las latas de frutas en conserva de la
agroindustria que afirma que los contenidos tiene distribucin normal con
media de 19 onzas y una desviacin estndar de 2 onzas. Qu tamao
mnimo de muestra debera escoger si quiere que la estimacin tenga un
error de 0.98 onzas con un nivel de confianza del 95%?
3) El ingreso mensual de cada una de las 500 microempresario de servicio
constituye una poblacin asimtrica cuya media se quiere determinar. Si una
muestra al azar de 50 microempresario se obtuvo un ingreso mensual
promedio de 1000 dlares con una desviacin estndar de 80 dlares,
obtenga un intervalo de confianza del 95%.
4) Para estimar la vida til de un producto se escogi una muestra aleatoria de
9 unidades del producto resultando las siguientes vidas:
775 780 800 795 790 785 795 780 810
Estime la media de la poblacin utilizando un intervalo de confianza del 95%
6) Un auditor escoge una muestra aleatoria de 10 cuentas por cobrar de una
compaa las cuales fueron:
730 759 725 740 754 745 75.
756 780
810 Estime la media de la poblacin utilizando un intervalo de
confianza del 95%
7) En un estudio socioeconmico se tomo una muestra aleatoria de 100
comerciantes informales y se encontr entre otros datos que solo el 30%
de ellos tienen ingresos superiores a 800 dlares por mes, obtenga el
intervalo de confianza de la proporcin de todos los comerciantes con
ingresos superiores a 800 dlares al 95% de nivel de confianza.
8) Un productor afirma que es el 5% el porcentaje de unidades defectuosa
que resulta del total de su produccin. Si una muestra aleatoria de 100
unidades de la produccin se encontraron 10 unidades defectuosas. Es
aceptable la afirmacin del productor con un 95% de nivel de confianza.

UCV Lima este

Pgina 114

Mtodos estadsticos

9) La oficina de planificacin familiar de cierta regin del pas quiere estimar el


porcentaje de familia con ms de 4 hijos en las zonas rurales. Si se escogi
una muestra de 385 familias y en ellas se encontr que 320 tiene ms de 4
hijos, estime el porcentaje de familias con ms de 4 hijos en toda la regin
aplicando un intervalo de confianza del 98%.
10) Una empresa cambiara su proceso actual de produccin, cuya desviacin
estndar de los tiempos empleados para procesar cada pieza es de 9
segundo, si solo hay prueba que el nuevo proceso es ms estable en cuanto
a variabilidad. Si una muestra aleatoria de los tiempos empleados para
producir 13 piezas con el nuevo proceso ha dado una desviacin estndar de
6 segundos, con un nivel de confianza del 95% debera la empresa
cambiarse al nuevo proceso de produccin?

UCV Lima este

Pgina 115

Mtodos estadsticos

UNIDAD DIDCTICA 3: ESTADSTICA INFERENCIAL APLICADA


Capacidades:
Aplica los conceptos bsicos de la estadstica orientados a la
Investigacin.
Aplica el modelo de regresin lineal y tcnicas de muestreo en su
trabajo de investigacin.
Determina si dos variables son independientes a travs de la prueba de
Chi Cuadrado y realiza el anlisis de varianza.

PRUEBA DE HIPTESIS

1. INTRODUCCIN
El objetivo de este tema es exponer los
mtodos estadstico bsicos que se aplican para
tomar decisiones sobre la conjetura que se hace
acerca del valor numrico del parmetro de una
poblacin en estudio
y
que es sometida
a
comprobacin experimental con el propsito de
determinar
si los
resultados
de una muestra
aleatoria extrada de esa poblacin contradicen o
no en forma significativa tal afirmacin.

2. HIPTESIS ESTADSTICA
Se denomina hiptesis estadstica a cualquier afirmacin o conjetura que
se hace acerca de la distribucin de una o ms poblaciones.
La afirmacin o conjetura se puede referirse bien a la forma o tipo de
distribucin de probabilidad de la poblacin o bien referirse al valor o valores
de uno o ms parmetro de la distribucin conocida su forma.
La hiptesis estadstica consiste en suponer que los parmetros, que define
a la poblacin, toma determinado valores numricos.
3. HIPTESIS NULA Y ALTERNATIVA
Se denomina hiptesis nula y se representa por H0 a la hiptesis que es
aceptada provisionalmente como verdadera y cuya validez ser sometida a
comprobacin experimental. Toda hiptesis nula va acompaada de una

UCV Lima este

Pgina 116

Mtodos estadsticos

hiptesis alterna que es lo contrario de la hiptesis nula. La hiptesis alterna se


representa por H1.
4. PRUEBA DE UNA HIPTESIS ESTADSTICA
La prueba de una hiptesis estadstica es un proceso que nos conduce a
tomar la decisin de aceptar o rechazar la hiptesis nula, en contraposicin a
la alterna y en base a los resultados de una muestra aleatoria seleccionada de
la poblacin en estudio.
5. TIPOS DE PRUEBAS DE HIPTESIS
El tipo de prueba depende bsicamente de la hiptesis alterna, se puede
encontrar pruebas de una cola donde la hiptesis alterna es unilateral y pruebas de
dos colas donde la alterna es bilateral.
6. REGIN RECHAZO
nula.

Es la regin que contiene los valores para los cuales se rechaza la hiptesis

7. REGIN DE ACEPTACIN
nula.

Es la regin que contiene los valores para los cuales no se rechaza la hiptesis

8. DECISIN
Si el valor del estadgrafo cae dentro de la regin de rechazo entonces
se rechaza la hiptesis nula.
9. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPTESIS
El procedimiento que se recomienda utilizar para pruebas de hiptesis con
parmetro se resume en los siguientes pasos:
Paso 1: Formular la hiptesis nula H0 y la hiptesis alternativa H1 apropiada

Prueba de una Cola


H0: = 0
H1: 0

UCV Lima este

Prueba de dos Colas


H0: = 0
H1: > 0

H0: = 0
H1: < 0

Pgina 117

Mtodos estadsticos

Paso 2: Seleccionar = Nivel de significacin


Paso 3: Establecer el estadgrafo apropiado a usar en la prueba y hallar D = valor
del estadgrafo
Paso 4: Establecer la regin crtica y de aceptacin para el estadgrafo. Recuerde que
la regin crtica debe ser construida en base al valor significante fijada en el paso 2
Prueba de una Cola

Prueba de dos Colas


R.C = < D ,
>
R.C = < - , D >

R.C = < - , - D / 2 > U < D


/2 , >

Paso 5: Si D pertenece a la regin crtica, entonces se rechaza la hiptesis nula.

10. PRUEBAS DE HIPTESIS DE LA MEDIA CON VARIANZA CONOCIDA

Prueba de una Cola

Fijar , donde

Prueba de dos Colas

Fijar , donde

Fijar , donde

Ejemplo 1
Un proceso automtico llena latas de palmito. Si el peso medio de las latas llenas es
400 gramos se afirma que el proceso est controlado, en caso contrario, el proceso no
est controlado. En el proceso de enlatado se ha determinado que los pesos de las
latas llenas tienen una desviacin estndar de 20 gramos. Si una muestra aleatoria de
100 latas llenas de palmito ha dado el peso medio de 395 gramos, se podra concluir
que el proceso est fuera de control al nivel de significacin 5%?

UCV Lima este

Pgina 118

Mtodos estadsticos

Solucin:
Sea : peso de las latas llenas de palmito
1.

Hiptesis:
(El proceso est controlado)
(El proceso est fuera de control)

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:

5.

Decisin: El valor -2.5 pertenece a la regin crtica, por lo que se debe


rechazar
Finalmente, con un riesgo de 5% se concluye que el proceso
de enlatado de palmito no est controlado.

Ejemplo 2
Al estudiar si conviene o no una sucursal en la ciudad de Ucayali, la gerencia de una
tienda comercial de Lima, establece el siguiente criterio para tomar una decisin: abrir
la sucursal slo si el ingreso promedio familiar mensual en dicha ciudad es no menos
de $500 y no abrirla en caso contrario. Si una muestra aleatoria de 100 ingresos
familiares de esa ciudad ha dado una media de $480. Cul es la decisin a tomar al
nivel de significacin del 5%?
Solucin:
Sea : ingresos familiares mensuales de los pobladores de Tarapoto.

1.

Hiptesis:
(Se abre la sucursal)
(No se abre la sucursal)

2.

Nivel del significacin:

UCV Lima este

Pgina 119

Mtodos estadsticos
3.

Estadgrafo:

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:
.

5.

Decisin: El valor -2.5 pertenece a la regin crtica, por lo que se debe


rechazar
Finalmente, con un riesgo de 5% se concluye no debe abrirse la
sucursal en Ucayali.

Ejemplo 3
Ante un reclamo sobre el tiempo de realizacin de una tarea, los empleados de una
compaa sostienen que en promedio ellos completan la tarea en a lo ms 13 minutos.
Si usted es el gerente de la compaa, qu conclusin obtiene si para una muestra de
400 tareas se obtiene un promedio de tiempo de finalizacin de 14 minutos? Se sabe,
por informacin de trabajos similares, que los tiempos de ejecucin de la tarea tiene
una distribucin normal con desviacin estndar de 10 minutos. Usar el nivel de
significancia
.
Solucin:
Sea : tiempo de realizacin de una tarea

1.

Hiptesis:
compaa)
compaa)

2.

(El tiempo de realizacin de la tarea no amerita un reclamo de la


(El tiempo de realizacin de la tarea amerita un reclamo de la

Nivel del significacin:

UCV Lima este

Pgina 120

Mtodos estadsticos
3.

Estadgrafo:

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:

5.

Decisin: El valor 2 pertenece a la regin crtica, por lo que se debe rechazar


Finalmente, con un riesgo de 5% se concluye que el reclamo realizado
por la compaa sobre el tiempo de realizacin de una tarea es justificado.

11. PRUEBAS DE HIPTESIS DE LA MEDIA CON VARIANZA DESCONOCIDA

Prueba de una Cola

Fijar , donde

Prueba de dos Colas

Fijar , donde
<

Fijar , donde

si
si

Ejemplo 1
En una muestra de 19 adolescentes que sirvieron de sujetos en estudio
inmunolgico, una variable de inters fue el dimetro de reaccin de la piel a
una prueba con un antgeno. La media muestral y la desviacin estndar fue
respectivamente, 21 y 11 mm de eritema. Puede concluirse a partir de estos
datos que la media de la poblacin es 30?
UCV Lima este

Pgina 121

Mtodos estadsticos

Solucin:
Sea : dimetro de reaccin de la piel a una prueba
1.

Hiptesis:
(El dimetro de la reaccin de la piel es igual a 30 mm)
(El dimetro de la reaccin de la piel es diferente a 30 mm)

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:

5.

Decisin: El valor -3.56 pertenece a la regin crtica, por lo que se debe


rechazar
Finalmente, con un riesgo de 5% se concluye que el dimetro
de reaccin de la piel a una prueba es diferente a 30 mm.

Ejemplo 2
Una muestra de 35 estudiantes de primer ao tuvo una calificacin media de
77 en una prueba efectuada para medir su actitud . La desviacin estndar
de la muestra fue de 10. Proporcionan estos datos evidencia suficiente como
para indicar, a un nivel de significacin 0.01 que la media de la poblacin es
menor que 80?
Solucin:
Sea : Puntaje obtenidos en la prueba de actitud

1.

Hiptesis:
(Puntaje obtenido en la prueba igual a 80)
(Puntaje obtenido en la prueba menor a 80)

UCV Lima este

Pgina 122

Mtodos estadsticos

2.

Nivel del significacin:

3.

Estadgrafo

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:
.

5.

Decisin: El valor -1.77 no pertenece a la regin crtica, por lo que no se debe


rechazar
Finalmente, con un riesgo de 1% se concluye que el puntaje
obtenido no es menor a 80.

Ejemplo 3
Un distribuidor de cosmticos ha conseguido cobrar sus cuentas pendientes en un
plazo medio de 22 das, durante el ao pasado. Este promedio se considera un
estndar para medir la eficiencia del departamento de crdito y cobranzas. Sin
embargo, durante el mes en curso, un chequeo aleatorio de 81 cuentas dio como
resultado un promedio de 24 das, con una desviacin estndar de 9 das. Es este
resultado significativamente diferente del estndar al nivel del 3%?
Solucin:
Sea : Cobro de cuentas
1.

Hiptesis:
(El cobro de cuentas se realiza en tiempo estndar)
(El cobro de cuentas no se realiza en tiempo estndar)

2.

Nivel del significacin:

3.

Estadgrafo:

UCV Lima este

Pgina 123

Mtodos estadsticos
4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:

5.

Decisin: El valor 2 no pertenece a la regin crtica, por lo que no se debe


rechazar
Finalmente, con un riesgo de 3% se concluye de que no existe
razn parar creer que el cobro de cuentas se realiza en tiempo diferente al
estndar.

12. PRUEBAS DE HIPTESIS PARA LA PROPORCIN


Prueba de una Cola

Prueba de dos Colas


Fijar , donde

Fijar , donde

Fijar , donde

Ejemplo 1
Un mdico afirma que cierto medicamento que se prescribe para aliviar determinada
enfermedad es efectivo al 78%. Con el fin de evaluar esta afirmacin se tom una
muestra aleatoria de 400 pacientes y se encontr que 300 de ellos han experimentado
alivio. Es sta, suficiente evidencia para concluir que realmente el medicamento no es
efectivo al 78%? Utilice el nivel de significacin del 1%.
Solucin:

1.

Sea : Efectividad del medicamento


Hiptesis:
(El medicamento es efectivo)
(El medicamento no es efectivo)

2.

Nivel del significacin:

3.

Estadgrafo:

UCV Lima este

Pgina 124

Mtodos estadsticos

4.

Regin Crtica: Primero se encuentra el valor crtico que es:


y luego la regin crtica es:

5.

Decisin: El valor -1.44 no pertenece a la regin crtica, por lo que no se debe


rechazar
Finalmente, con un riesgo de 1% se concluye que el
medicamento es efectivo y el mdico tena razn.

Ejemplo 2
Se afirma que cierto programa de mejoramiento gentico en alpacas de raza Huacaya
es efectivo en ms del 60%. Al parecer esta afirmacin es exagerada por lo que decide
evaluar esta afirmacin, tomando una muestra aleatoria de 200 alpacas resultando
que 173 alpacas mejoraron genticamente. Es sta suficiente evidencia para concluir
que realmente el programa de mejoramiento gentico es efectivo en ms del 60% de
los casos al nivel de significancia del 5%?
Solucin:
Sea : Efectividad de mejoramiento gentico en alpacas
1.

Hiptesis:

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica:
Primero se encuentra el valor crtico que es:
y luego la regin crtica es:

UCV Lima este

Pgina 125

Mtodos estadsticos

5.

Decisin: El valor 7.65 pertenece a la regin crtica, por lo que se debe


rechazar
Finalmente, con un riesgo de 5% se concluye que que el
programa de mejoramiento gentico es efectivo en ms del 60% de los casos.

Ejemplo 3
El consumidor de un cierto tipo de producto acus al fabricante diciendo que ms del
20% de las unidades que fabrica son defectuosas. Para confirmar su acusacin, el
consumidor us una muestra aleatoria de tamao 50, donde el 27% de las unidades
eran defectuosas. Qu conclusin puede extraer usted? Use
Solucin:
1.

Hiptesis:

(La afirmacin del consumidor no es verdadera)


(La afirmacin del consumidor es verdadera)
2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica:
Primero se encuentra el valor crtico que es:
y luego la regin crtica es:

5.

Decisin: El valor 1.24 no pertenece a la regin crtica, por lo que no se debe


rechazar
Finalmente, con un riesgo de 1% se concluye que la muestra no
da evidencia para apoyar al consumidor.

UCV Lima este

Pgina 126

Mtodos estadsticos

13. PRUEBAS DE HIPTESIS PARA LA VARIANZA

Prueba de una Cola

Prueba de dos Colas

Fijar , donde

Fijar , donde

Fijar , donde

Ejemplo 1
En un proceso de fabricacin, se plantea la hiptesis que la desviacin estndar de las
longitudes de cierto tipo de tornillo es 2 mm. En una muestra de de diez tornillo
elegidos al azar del proceso de produccin se obtuvo una desviacin estndar de 2.60
mm. Con estos datos se justifica la suposicin que la desviacin estndar verdadera es
2 mm? Use
y suponga que la distribucin de las longitudes es normal.
Solucin:
1.

Hiptesis:

(La afirmacin del consumidor no es verdadera)


(La afirmacin del consumidor es verdadera)

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica:
Primero se encuentra los valores crticos que son:
,y

Finalmente, la regin crtica es:


UCV Lima este

Pgina 127

Mtodos estadsticos
5.

Decisin: El valor 15.21 no pertenece a la regin crtica, por lo que no se debe


rechazar
Finalmente, se concluye que la varianza de la poblacin es igual
a 4.

Ejemplo 2
Un bilogo cree que la varianza de vida de cierto organismo al ser expuesto a cierto
agente mortal, es a lo ms 625 minutos al cuadrado. Una muestra aleatoria de 15
organismos dio una varianza de 1225. Proporcionan estos datos evidencia suficiente
como para concluir la investigacin del bilogo acerca de que la variabilidad es
incorrecta?
Solucin:
1.

Hiptesis:
(La investigacin del bilogo es correcta)
(La investigacin del bilogo no es correcta)

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica: El valor crtico es:


Entonces, la regin crtica es:

5.

Decisin: El valor 27.44 pertenece a la regin crtica, por lo que se debe


rechazar
Finalmente, los datos proporcionados por el bilogo acerca de
la variabilidad es incorrecta con un riesgo del 5%.

UCV Lima este

Pgina 128

Mtodos estadsticos

Ejemplo 3
Una de las maneras de mantener bajo control la calidad de un producto es controlar
su varianza. Una mquina para enlatar conservas de durazno est regulada para llenar
con una desviacin estndar de 10 gr. y con una media de 500 gr Dira usted que la
mquina ha sido adecuadamente regulada en relacin a la varianza, si una muestra de
16 latas de conserva dio una varianza de 169 gr2? Use un
y el peso de cada
lata de conserva presenta una distribucin norma
Solucin:
1.

Hiptesis:

2.

Nivel del significacin:

3.

Estadgrafo:

4.

Regin Crtica:
Primero se encuentra los valores crticos que son:
,y

Finalmente, la regin crtica es:


5.

Decisin: El valor 25.35 no pertenece a la regin crtica, por lo que no se


debe rechazar
Finalmente, se concluye que la mquina est bajo control
en cuanto a la varianza.

UCV Lima este

Pgina 129

Mtodos estadsticos

EJERCICIOS PROPUESTOS
1. La concentracin media de dixido de carbono en el aire en una cierta zona no es
habitualmente mayor que 355 p.p.m.v (partes por milln en volumen). Se
sospecha que esta concentracin es mayor en la capa de aire ms prxima a la
superficie. Para contrastar esta hiptesis se analiza el aire en 60 puntos elegidos
aleatoriamente a una misma altura cerca del suelo con una media muestral de 580
p.p.m.v. Suponiendo normalidad para las mediciones, proporciona estos datos
suficiente evidencia estadstica para afirmar que la concentracin media es mayor
cerca del suelo? Use
y
a.
b.
c.
d.

, se rechaza
, no se rechaza
, se rechaza
, no se rechaza
Respuesta: Clave a

2. El promedio de nicotina que tienen los cigarros de cierta marca es igual a 11mg. Se
sabe que la distribucin de la cantidad de nicotina es normal con desviacin
estndar igual a 0.5mg. El creador de un nuevo procedimiento de fabricacin
asegura que su procedimiento disminuye el promedio de 11mg. Al nivel de
significacin
, se puede decir que el nuevo procedimiento disminuye el
promedio de nicotina?
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c

3. Antes de la aplicacin de un nuevo plan vital en la ciudad el promedio de


accidentes de trnsito por da era de 15.6. para determinar si el nuevo plan ha sido
efectivo en la reduccin del promedio de accidentes, se observaron al azar 81 das
posteriores a la aplicacin del nuevo plan obtenindose un promedio de 12
accidentes por da con una desviacin estndar igual a 3. Al nivel de significacin
, se podra decir que existe evidencia de que el promedio de accidentes
por da ha disminuido?
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave d

UCV Lima este

Pgina 130

Mtodos estadsticos

4. En diez mediciones sobre la resistencia de un alambre se obtuvieron los siguientes


resultados:
y
. Suponiendo que la variable X que representa a
las mediciones sigue una distribucin normal, probar la siguiente hiptesis:
al nivel de significacin
.
a. No se rechaza , No se puede indicar que la media no es igual o menor que
10
b. Se rechaza , Se puede indicar que la media no es igual o menor que 10
Respuesta: Clave a
5. Un gobernante afirma que en su pas existe el 40% de analfabetos. Con el fin de
evaluar est afirmacin se tom una muestra de 500 personas resultando que 300
son analfabetos. Sobre la base de la informacin obtenida qu se puede decir
acerca de la afirmacin del gobernante? Usar
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave b

6. Una empresa afirma que su producto tiene una participacin del 50% del
mercado. Para tomar una decisin respecto de lo afirmado por dicha empresa se
encuesta a 48 personas consumidoras del producto y se encuentra que 18
consumen el producto fabricado por la empresa en cuestin. Cul es la decisin
que se toma con un nivel de significancia de 2.5%?
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c

7. El fabricante de una patente mdica sostiene que la misma tiene un 90% de


efectividad en el alivio de una alergia, por un periodo de 8 horas. En una muestra
de 200 individuos que tenan la alergia se les suministro el medicamento y 160
personas mostraron alivio. Determinar si la aseveracin del fabricante es cierta.
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave d

UCV Lima este

Pgina 131

Mtodos estadsticos

8. La variabilidad de los pesos en un determinado proceso de produccin est


controlado si la desviacin estndar de los pesos de los contenidos de los
envases es 0.25 onzas pero, una muestra al azar de pesos de los contenidos de
20 envases ha dado una desviacin estndar de 0.30 onzas. Al nivel de
significancia del 5% proporciona estos datos indicio suficiente que indique un
aumento significativo de tal variabilidad?
a.
b.
c.
d.

no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave a

9. Con el fin de poder diferenciar a las personas con una aptitud baja y personas con
una aptitud alta para desempear determinada actividad, es necesario que la
variabilidad de los resultados de una prueba que se aplica a los postulantes a dicha
actividad sea alta. La recomendacin es que la variabilidad de la prueba, medida
por la varianza, sea
. Cuando la prueba se aplico a 12 postulantes la
varianza de los resultados fue
. Se podra decir que la prueba satisface los
requerimientos? Usar
y suponer normalidad.
a.
b.
c.
d.

, no se rechaza
, se rechaza
, no se rechaza
, se rechaza
Respuesta: Clave c

10. Un fabricante de mquinas de llenado de leche en bolsas, asegura que cada una
stas deposita en las bolsas un promedio de un litro con varianza igual a 0.01.
una muestra de 10 bolsas se hall la varianza muestra
. Al nivel
significacin
, probar la hiptesis
,
adems se supone que la cantidad vertida tiene distribucin normal.

de
En
de
si

a. No se rechaza , Se puede indicar que el llenado de bolsas tiene una varianza


menor o igual a 0.01
b. Se rechaza
, Se puede indicar que el llenado de bolsas tiene una varianza
mayor a 0.01
Respuesta: Clave b

UCV Lima este

Pgina 132

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 133

Mtodos estadsticos

ANLISIS DE DATOS CATEGRICOS

1. INTRODUCCIN
Las pruebas de hiptesis de proporciones de
categora de variables cualitativas en tablas de
contingencia son las siguientes:
Prueba de independencia
de variable
cualitativa
Prueba de homogeneidad de muestra
Prueba de igualdad
de ms de dos proporciones
independiente.

de poblaciones

Pruebe la bondad de ajuste entre las frecuencia observada en los intervalos y


las correspondiente frecuencia esperada de una distribucin normal, con un nivel de
significacin del 5%.
2. PRUEBA DE INDEPENDENCIA
La prueba de hiptesis de independencia implica dos variables categricas y
lo que se prueba es la suposicin de que las dos variables son estadsticamente
independiente.
Para cada frecuencia observada en una celda hay una frecuencia esperada
que se calcula a partir de la hiptesis especificada y que se supone que es verdadera.
H0: Las dos variables cualitativas son independientes.
3. PROCEDIMIENTO PARA REALIZAR LA PRUEBA DE INDEPENDENCIA
1. Formular las hiptesis
2. Seleccionar el nivel de significacin
3. Calcular los valores esperados: Se realiza utilizando la frmula
4. Calcular el valor del estadgrafo:

5. Regin Crtica:

UCV Lima este

Para el nivel de significancia dado, el valor crtico es :

Pgina 134

Mtodos estadsticos

6. Decisin: Si

, se debe rechazar

EJEMPLO 1
500 artculos se escogieron al azar de artculos producidos. Esto es independiente
segn la calidad y segn la lnea de produccin, como se indica en la tabla que sigue:
Lnea de produccin
1
2
3
40
90
70
50
60
60
60
50
20

Calidad
c1
c2
c3

A nivel de significacin del 5% se puede inferir que la calidad del producto es


independiente de la lnea de produccin?
Solucin
1.

Hiptesis:

2.

Nivel del significacin:

3.

Calculo de valores esperados: Se realiza utilizando la frmula

Calidad

Lnea de produccin
1

Total

c1
c2
c3
Total
4.

Estadgrafo:

5.

Regin Crtica: Para el nivel de significancia

6.

Decisin: Dado que

UCV Lima este

el valor crtico es :

, por lo tanto se debe rechazar


Pgina 135

Mtodos estadsticos

Finalmente, se concluye que la calidad del producto no es independiente de la lnea


de produccin.
EJEMPLO 2
En un proceso de produccin se registr el nmero de objetos defectuosos
clasificndolos por turnos de produccin y por mquina de produccin. Verificar al
nivel de significacin
si el nmero de objetos defectuosos producidos por las
mquinas es independiente de los turnos de produccin. Los datos se muestran en la
siguiente tabla:

Mquinas
Turnos

Total

Maana

75

90

85

250

Tarde

70

85

70

225

Noche

95

85

75

255

Total

240

260

230

730

Solucin
1.

Hiptesis:

2.

Nivel del significacin:

3.

Calculo de valores esperados: Se realiza utilizando la frmula

UCV Lima este

Pgina 136

Mtodos estadsticos

Mquinas

Turnos
A

Total
C

Maana

Tarde

Noche

Total

4.

Estadgrafo:

5.

Regin Crtica:

6.

Decisin: Dado que


, por lo tanto no se debe rechazar
Finalmente,
se concluye que el nmero de objetos defectuosos producidos por las mquinas no
depende de los turnos.

Para el nivel de significancia

el valor crtico es:

4. PRUEBA DE HOMOGENEIDAD
Con la prueba de homogeneidad de muestra se busca determinar si dos o ms
muestra independiente proviene de una misma poblacin. Como en el mtodo
anterior, para esta prueba los datos muestrales se registran en celda de tabla de
contingencia de orden k * c.
H0: La muestra aleatoria proviene de una misma poblacin.

UCV Lima este

Pgina 137

Mtodos estadsticos

5. PROCEDIMIENTO PARA REALIZAR LA PRUEBA DE INDEPENDENCIA


1.

Formular las hiptesis

2.

Seleccionar el nivel de significacin

3.

Calcular los valores esperados: Se realiza utilizando la frmula

4.

Calcular el valor del estadgrafo:

5.

Regin Crtica: Para el nivel de significancia dado, el valor crtico es :

6.

Decisin: Si

, se debe rechazar

EJEMPLO 3
Se efectu un estudio en tres colegios de Lima para determinar las preferencias de los
alumnos por tres tipos de deportes. Una muestra de 500 alumnos ha hado los
resultados de la tabla que sigue. A partir de estos datos, determine si los tres son
homogneos con respecto a sus preferencias en los tres deportes. Utilice
.
Deportes

Colegios

Total

Futbol

80

70

100

250

90

90

60

30

180

20

30

20

20

70

Total

200

150

150

500

Solucin
1.

Hiptesis:

2.

Nivel del significacin:

3.

Clculo de valores esperados: Se realiza utilizando la frmula

UCV Lima este

Pgina 138

Mtodos estadsticos

Turnos

Mquinas
A

Total

Maana
Tarde
Noche
Total
4.

Estadgrafo:

5.

Regin Crtica:

6.

Decisin: Dado que


, por lo tanto se debe rechazar
Finalmente, se
concluye que para cuando menos un deporte, las preferencias en los tres colegios
no son las mismas.

Para el nivel de significancia

el valor crtico es :

EJEMPLO 4
Un investigador estudia el nivel de efectividad de tres remedios para aliviar cierta
enfermedad. Para esto escogi tres muestra aleatoria de tamao 50, 70 y 60 de
paciente de cierta enfermedad suministrando a la primera el remedio uno, al
segundo el remedio dos y al tercero el remedio tres y midiendo la efectividad de
los remedios en tres niveles: sin alivio, cierto alivio y alivio total. Los resultados del
experimento se dan en la tabla que sigue:

Efectividad

Remedios para la alegra


1

sin alivio

10

20

15

cierto alivio

30

20

20

alivio total

10

30

25

Puede usted inferir con probabilidad


igualmente efectivos?

UCV Lima este

igual a

0.01

que los tres remedios son

Pgina 139

Mtodos estadsticos

Solucin
1. Hiptesis:

2.

Nivel del significacin:

3.

Clculo de valores esperados: Se realiza utilizando la frmula

Efectividad

Remedios para la alegra


1

Sin alivio

Cierto alivio

Total

Alivio total
Total
4.

Estadgrafo:

5.

Regin Crtica: Para el nivel de significancia

6.

Decisin: Dado que


, por lo tanto se debe rechazar
Finalmente, se concluye que para cuando menos un remedio, la efectividad
no es la misma.

UCV Lima este

el valor crtico es :

Pgina 140

Mtodos estadsticos

PRACTICA DIRIGIDA
1. Una muestra de empleados de la universidad clasificada como docentes, no
docentes y de servicio, se les pidi que escogiera entre planes de seguro
familiar particular, en el cuadro que sigue se dan los resultados:
Plan de seguro
Clase
Docente

100

150

60

No
docente

40

70

20

Servicios

20

40

10

Se puede afirmar que el plan de seguro depende de la clase de trabajo.


a.
, no se rechaza H0
b.
, se rechaza H0
c.
, no se rechaza H0
d.
, se rechaza H0
Respuesta: Clave a
2. Un estudio de mercado de una empresa proporciona la tabla de datos que
sigue, donde la muestra de 800 consumidores de un producto especfico opina
acerca de las tres formas presentacin y de la tres marcas que aparecen en el
mercado:

Presentacin

Marca del producto


M1

M2

M3

P1

200

130

70

P2

60

60

80

P3

40

60

100

Existe relacin entre la marca y la presentacin del producto.


a.
, no se rechaza H0
b.
, se rechaza H0
c.
, no se rechaza H0
d.
, se rechaza H0
Respuesta: Clave b

UCV Lima este

Pgina 141

Mtodos estadsticos

3. En una empresa se desea estudiar si existe una dependencia entre el nivel de


remuneraciones y los aos de experiencia del personal. Con este objeto, se
clasifican las remuneraciones en tres categoras: bajo, medio y alto y los aos de
experiencia en cuatro categoras: A, B, C y D. Al nivel del 10% Hay alguna
relacin entre los aos de experiencia y las remuneraciones que perciben los 100
empleados?
Aos de experiencia

Total

Remuneracin

Bajo

11

14

38

Medio

12

33

Alto

10

29

Total

26

26

24

24

100

a.
b.
c.
d.
Respuesta: Clave d

, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0

4. En la siguiente tabla se muestran los resultados obtenidos por 435 estudiantes en


los cursos de Estadstica y Clculo I. Contraste la hiptesis de que las notas
obtenidas en Estadstica I son independientes de las notas obtenidas en Clculo I,
al nivel de 2.5%
Notas
Matemtica
I

0 10

11 14

15 20

0 10

70

40

15

125

11 14

30

130

25

185

15 20

15

60

50

125

Total

115

230

90

435

a.
b.
c.
d.
Respuesta: Clave d
UCV Lima este

Notas Estadstica I
Total

, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0

Pgina 142

Mtodos estadsticos

5. Un grupo de investigadores desean determinar si existe asociacin entre el nivel


educativos de los individuos y la preferencia por un determinado medio de
comunicacin. A continuacin se presentan los resultados obtenidos aplicado por
los investigadores a 290 individuos.
Medio de Comunicacin

Nivel
educativo

Prensa

Radio

TV

Primaria

15

10

25

50

Secundaria

40

25

45

110

Superior

45

30

55

130

Total

100

65

125

Total

290

Teniendo en cuenta la informacin presentada, qu le dira usted al grupo de


investigadores con un nivel de significancia de 2.5%?
a.
b.
c.
d.
Respuesta: Clave a

, no se rechaza H0
, se rechaza H0
, no se rechaza H0
, se rechaza H0

6. Dos investigadores toman muestras de una misma ciudad con el objeto de estimar
el nmero de personas que corresponden a los grupos de renta de clase pobre,
media y alta (los lmites de los grupos se expresan en cantidad de dinero y son los
mismos para los dos investigadores). Los resultados que se obtuvieron fueron:

Investigador

Rentas

Total

Pobre

Media

Alta

150

100

20

270

150

80

30

260

Total

300

180

50

530

Presentan estos datos suficiente evidencia para decir que las muestras de uno de
los investigadores es sospechosa? Use nivel de significancia al 5%?
a.
, no se rechaza H0
b.
, se rechaza H0
c.
, no se rechaza H0
d.
, se rechaza H0
Respuesta: Clave c
UCV Lima este

Pgina 143

Mtodos estadsticos

7. Se realiz una encuesta entre los votantes de 4 distritos de Lima para comparar las
proporciones de votantes a favor del candidato A para la alcalda de Lima. Se
tom una muestra de 300 votantes cada uno de los 4 distritos, obtenindose los
siguientes resultados:
Votos

Lince

Distritos
Brea
Cercado

Comas

Total

A favor de A

126

103

109

98

436

En contra de A

174

197

191

202

764

Total

300

300

300

300

1200

Presentan los datos suficiente evidencia que indique que las proporciones de
votantes que estn a favor del candidato A en los 4 distritos, son diferentes? Use
nivel de significancia al 5%
a.
b.
c.
d.
Respuesta: Clave b

, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0

8. Una hacienda que siembra manzanas est interesada en determinar si dos tipos de
fertilizantes producen los mismos efectos en la produccin de manzanas. Con tal
fin las manzanas son abonadas con dos marcas distintas de fertilizantes F1 y F2. El
resultado fue que unas manzanas aumentaron su produccin, otras las
disminuyeron y otras no variaron, estos resultados se presentan en la siguiente
tabla:
F1
F2
Total
Produccin
Total

200

350

550

200

150

350

100

100

200

500

600

1100

Presentan los datos suficiente evidencia que indique que los dos tipos de
fertilizantes producen los mismos efectos? Use nivel de significancia al 5%
a.
b.
c.
d.
Respuesta: Clave a
UCV Lima este

, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0

Pgina 144

Mtodos estadsticos

9. El gerente de venta de una empresa afirma que las ventas de cuatros de sus
principales producto es homognea entre sus clientes clasificados por tipos de
ocupacin. Si su afirmacin est sustentada entre otras cosas en la muestra
aleatoria de las ventas a mil clientes tabulada como sigue:
Ocupacin

Producto
2
3

Profesionales

30

35

55

40

Comerciantes

155

50

125

80

Obreros

130

30

105

50

Ama de casa

35

15

20

45

Al nivel de significacin del 5% Qu opina usted de la afirmacin del gerente?


a.
b.
c.
d.
Respuesta: Clave a

, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0

10. Una muestra de televidentes clasificados por clase social y por la sintona
diaria de cuatro programa TV del medioda se da en la siguiente tabla:

Programa

Clase social
Pobre

Media baja

Media

Alta

190

280

500

280

250

300

350

150

3
4

160
100

250
150

180
80

120
80

Al nivel de significancia del 5% Es homogneo el ranking de los 4 programas


en las cuatro clases sociales?
a.
b.
c.
d.
Respuesta: Clave d

UCV Lima este

, se rechaza H0
, no se rechaza H0
, no se rechaza H0
, se rechaza H0

Pgina 145

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CORDVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 146

Mtodos estadsticos

ANLISIS DE VARIANZA
1. INTRODUCCIN
El anlisis de varianza para experimentos diseado, es una tcnica estadstica
que se aplica para comprobar si son iguales las medias de ms de dos poblaciones
independiente mediante la comparacin de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja con muestras
adecuadamente la recoleccin de datos.

pequeas;

por esta razn, se planifican

La tcnica estadstica del anlisis de varianza ha encontrado aplicacin en casi


toda las disciplinas cientficas y han llegado a convertirse en un tema muy amplio.
El trmino factor (cualitativo) se da a cada una de las variables independiente
que involucra el problema de anova, relacionada con una variable dependiente o
variable respuesta (cuantitativa); los valores de un factor son denominado niveles o
tratamientos en el diseo anova.
La variable dependiente x podra estar asociada a dos factores, cada elemento
de muestra contenida en todas las combinaciones de los niveles de los dos
factores es una unidad experimental. Los modelos se clasifican segn el nmero de
factores o variable independiente.
2. ANLISIS DE VARIANZA DE
COMPLETAMENTE ALEATORIZADO

UN

SOLO

FACTOR

DISEO

En un diseo de experimento completamente aleatorio que se aplica para


comparar k tratamiento de un factor, los tratamientos se asignan al azar a las
unidades experimentales de la muestra, de manera que un tratamiento escogido al
azar es aplicado a una muestra, el siguiente tratamiento escogido al azar de lo que
restan es aplicado a otra muestra y as sucesivamente.
1

TRATAMIENTO DEL FACTOR A


2
3
4

TOTAL
5

TOTAL

MUESTRA

MEDIA
VARIANZA

UCV Lima este

Pgina 147

Mtodos estadsticos

Suma de los datos de la muestra i


Suma total de los datos
Numero de datos de la muestra i
Nmero total de datos
Media de la muestra i
Media general

MODELO DE CLASIFICACIN SIMPLE


Modelo de efectos fijos: Este modelo es aplicable cuando se desea comparar las
caractersticas dependiente x bajo k tratamientos prefijado de inters. Las
conclusiones sern validas solo para esto k tratamientos.
Modelo de
tratamiento
se elige al
conclusiones

efecto aleatorio: Se emplea cuando se tiene una gran poblacin de


y por lo tanto resulta poco prctico compralos a todos. En este caso
azar solo k tratamientos de la poblacin y luego se infiere las
a toda la poblacin de tratamientos.

HIPTESIS DEL MODELO DE CLASIFICACIN


Planteamiento de Hiptesis:
Ho:
Ha: No todas las

son iguales

ESTADSTICA DE PRUEBA
Sumas cuadradas
SCT = suma del cuadrado total

SCT X ij2

SCTR = suma de cuadrado de tratamiento


SCE = suma de cuadrado del error

X ..2
n

X
SCTR
ni .

2
i.

X ..2

SCE = SCT - SCTR

Medias cuadrticas

MCT

SCT
n 1

UCV Lima este

MCTR

SCTR
k 1

MCE

SCE
nk

Pgina 148

Mtodos estadsticos

La estadstica de prueba

MCTR
MCE

F (K 1; n k)

CUADRO DEL ANLISIS DE LA VARIANZA


Fuente de
Variacin

Suma de Grados de
Cuadrados Libertad

Cuadrados
Medios

Tratamientos

SCTR

k-1

CMTR

Residual

SCE

n-k

CME

Global

SCT

n-1

Razn F
calculada

EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 mquinas de marcas diferentes
para su uso en una produccin especifica. Por esto, utilizo cada mquina al azar
para procesar cinco unidades del producto registrando los tiempo por unidad, en
segundos, resultando as el experimento completamente aleatorio. Los datos
observados son los siguientes:
M1:
M2:
M3:
M4:

55
60
64
42

46
58
62
45

45
68
51
52

73
58
57
44

50
63
65
42

Con un nivel de significancia del 5% pruebe la hiptesis que las mquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2
Cuatro profesores cada uno con un grupo de alumnos, ensean el mismo curso de
estadstica, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:
P1:
P2:
P3:
P4:

12
14
13
10

11
16
12
14

09
13
08
17

17
18
11
14

12
17
12
15

Al nivel de significancia del 5% se puede concluir que existe diferencia significativas


en las calificaciones promedios obtenidas con los cuatros profesores?

UCV Lima este

Pgina 149

Mtodos estadsticos

EJERCICIOS PROPUESTOS

1. El proyecto acadmico de un ingeniero es el diseo de un experimento a fin de


determinar el rendimiento de cuatro variedades de papa si tener en cuenta la
influencia de la fertilidad de la tierra de cultivo. Las 20 parcelas de igual
fertilidad que le fueron asignados los divido en 4 grupos de 5 parcelas cada
una. A cada grupo de parcelas le asigno una variedad distinta de papas
escogida al azar, resultando
un diseo completamente aleatorizado. los
rendimientos medido en kilogramos de la cinco variedades por parcelas son la
siguientes:
V1
V2
V3
V4

55
52
53
52

53
58
55
50

60
50
57
51

52
60
51
49

53
52
54
53

Al nivel de significancia del 5% se puede inferir que existe


significativa entre las producciones media de las 4 variedades.

diferencia

2. Para comparar el tiempo empleado en realizar una tarea especfica bajo tres
procedimientos un investigador diseo un experimento seleccionando al azar
tres muestra independiente de 10 operarios cada una y asigno al azar un
procedimiento a cada muestra. Los tiempos registrado en segundo son los
siguientes:
P1
P2
P2

13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07 13.65 18.79
22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08 18.35 17.22
18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44 18.47 25.42

Existe diferencia significativa entre los promedios de tiempo?


3. Una empresa de transporte terrestre va a adquirir una de 4 marcas de
neumtico que hay en el mercado. El ingeniero de pruebas de la empresa dise
un experimento escogiendo al azar seis neumticos de cada marca de
caracterstica similares. En el laboratorio de prueba, con una carga especfica
simulada, observo la duracin de cada neumtico hasta que se deteriore. Los
datos son los siguiente:
N1
N2
N3
N4

55
63
48
59

53
67
50
68

50
55
59
57

60
62
50
66

55
70
47
71

65
75
61
73

Indica estos datos que las marcas de los neumticos producen efectos
significativo en el rendimiento?
UCV Lima este

Pgina 150

Mtodos estadsticos

4. Un promotor inmobiliario considera invertir en un centro comercial a


construir en el sector medio de una capital del interior del pas. Se evala cuatro
ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy importante el
nivel de los ingresos mensuales de familia. Los ingresos mensuales en dlares son
los siguientes:
Arequipa:
Iquitos:
Piura:
Trujillo:

710
610
560
500

560
560
610
400

490
490
470
500

550
550
510
550

568
610
580
520

Producen efectos significativos en la variabilidad de los ingresos los niveles de


factor ciudad?
5. El decano de FACI desea estudiar el nmero de horas que los alumnos de los
ciclo 5, 6, 7 y 8 utilizan los terminales de cmputos de la universidad. Una
muestra de usos por ciclo ha dado los siguientes tiempos en horas mensuales:
C5:
C6:
C7:
C8:

35
43
28
39

33
47
30
48

30
35
39
37

40
45
30
46

Existe diferencia significativa en el tiempo segn el ciclo de estudio?

UCV Lima este

Pgina 151

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 152

Mtodos estadsticos

REGRESIN LINEAL SIMPLE


1. INTRODUCCIN
En muchas aplicaciones estadstica se debe resolver problemas que contiene
un conjunto de variables y que se sabe existe alguna asociacin entre ellas. En
este conjunto de variables muy a menudo se tiene una sola variable dependiente,
que depende de una o ms variable independiente.
La primera forma del estudio de la asociacin entre las variables X e Y
es la regresin, que consiste en determinar una relacin funcional entre ellas,
con el fin de que se pueda predecir el valor de una variable en base a la
otra. La variable que se va predecir se denomina variable dependiente y la
variable que es la base de la prediccin se denomina variable independiente.
La segunda forma del estudio de la asociacin entre las variables X e Y,
es denominada correlacin, que consiste en determinar la variacin conjunta de
las dos variables, su grado de relacin y su sentido. La medida del grado de
la relacin se denomina coeficiente de correlacin. El cuadrado del ndice de
correlacin se denomina coeficiente de determinacin.
Se realizar un estudio de la regresin lineal en el sentido que, la ecuacin
de regresin que se calcula ser vlida, solo si hay la seguridad de que existe un alto
nivel de correlacin entre las variable medido por el coeficiente de
determinacin.
Los mtodos de regresin y
variable independiente en simple o
simple, si hay una sola variable
independiente se denomina anlisis

de correlacin se clasifican por el numero de


mltiple. El anlisis de asociacin se denomina
independiente. Si hay dos o ms variable
de asociacin mltiple.

2. DIAGRAMA DE DISPERSIN
Se denomina diagrama de dispersin o nube de puntos, a la grfica de
los valores (x,y) de las variables X e Y en el sistema cartesiano.
Es frecuente visualizar el tipo de relacin existente entre dos variables a partir
del diagrama de dispersin.

UCV Lima este

Pgina 153

Mtodos estadsticos

3. LA COVARIANZA
La covarianza de los datos observado en una muestra es la estadstica que
mide el nivel de la variabilidad conjunta de los datos de las variables en pareja
con respecto a sus medias respectivas.

4. EL COEFICIENTE DE CORRELACIN
El coeficiente de correlacin lineal de Pearson de los n pares de valores de
una variable bidimensional (x,y) es el numero abstracto o relativo r que se calcula
por:

Otra expresin que se suele usar es:


r

cov( x, y )

SS
x

Donde:
Cov(x,y) es la covarianza de x e y.
es la desviacin estndar de x.
es la desviacin estndar de y.
El coeficiente de correlacin de la muestra es un nmero real comprendido
entre -1 y 1. El grado o nivel de ajuste de la ecuacin a los datos se analiza en
forma descriptiva aplicando el coeficiente de determinacin que se define como
el cuadrado del coeficiente de correlacin.
Interpretacin:

Si r = 1, hay una correlacin perfecta positiva.


Si r = -1, hay una correlacin perfecta negativa.
Si r = 0, no hay correlacin entre las dos variables.

5. REGRESIN LINEAL SIMPLE


Dados n pares de valores de una variable bidimensional, la regresin
lineal simple Y con respecto a X, consiste en determinar la ecuacin de la
recta:
Y= a+bx
UCV Lima este

Pgina 154

Mtodos estadsticos

Que mejor se ajusta a los valores de la muestra, con el fin de poder predecir
o estimar Y a partir de X.
El proceso de predecir o estimar Y a partir de la variables X , es la regresin.
Hallar la funcin lineal, consiste en determinar las constante a y b a
partir de los datos de la muestra, para lo cual se usara el mtodo de mnimos
cuadrados.

Otra expresin para b es:

cov( x, y )

x2
__

__

a y b x

Interpretacin de coeficiente de regresin b

Si b > 0, entonces la tendencia lineal es creciente, es decir a mayores


valores de X corresponde mayores valores de Y. Tambin a menores
valores de X menores valores de Y.

Si b < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores


valores de X corresponde menores valores de Y. Tambin, a menores
valores de X corresponde mayores valores de Y.

Si b = 0, entonces Y permanece estacionario para cualquier valor de X es


decir no hay regresin.

6. COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin es una medida de la proximidad del ajuste
de la recta de regresin. Cuanto mayor sea el valor, mejor ser el ajuste y ms til
la recta de regresin como instrumento de prediccin; para calcular el coeficiente
de determinacin se eleva al cuadrado el coeficiente de correlacin. El nmero r2 es
denominado coeficiente de determinacin.

UCV Lima este

Pgina 155

Mtodos estadsticos

7. VARIANZA ESTIMADA DE REGRESIN


El segundo mtodo para medir el ajuste de la estimacin del modelo de
regresin a los datos de la muestra, es aplicar el error estndar de la estimacin,
que desarrollaremos a continuacin:

s2

2
SCE y a y b xy

n2
n2

La raz cuadrada positiva de la varianza de regresin es la desviacin


estndar de la regresin, y se le denomina error estndar de estimacin.
El error estndar de la estimacin al igual que la varianza, es una medida de
la dispersin o concentracin de los valores observados alrededor del modelo de
regresin.
Mientras ms pequeo sea el valor del error estndar de estimacin, ms
cercano a la lnea de regresin estarn los valores estimados.
8.

INFERENCIA ACERCA DE LOS COEFICIENTE DE REGRESIN

No trataremos las inferencia acerca del parmetro a porque a menudo


carece de importancia, pues a es la ordenada en el origen y representa la
interseccin de los ejes cuando x = 0.
Nos referimos a la inferencia acerca del parmetro b la pendiente de la lnea
de regresin en la poblacin.
Antes de aplicar el modelo estimado de la regresin lineal para realizar
predicciones de Y en funcin de X, se debe analizar si el valor de la pendiente B es
o no es significativo.
Entonces para evaluar el parmetro se puede utilizar cualquiera de los tres mtodos:
Intervalo de confianza b
Prueba de hiptesis b
Anlisis de varianza para b
INTERVALO DE CONFIANZA
Para poder calcular el intervalo de confianza se debe realizar los siguientes pasos:

Diferencia cuadrada de x con respecto a la media:

Varianza estimada de b:

Intervalo de confianza para b:

UCV Lima este

S b2

___ 2

S XX X n X
2

s
s xx

Pgina 156

Mtodos estadsticos

Si el valor cero pertenece al intervalo entonces decimos que la b es igual a cero


que no es significativo en el modelo.
PRUEBA DE HIPTESIS
Si se plantea la hiptesis que b es igual a cero; esta hiptesis se rechazar
si el valor encontrado en la tabla es menor que el valor del estadstico. Esta
prueba es bilateral.
Hiptesis 1:
Ho: a = 0
Ha: a 0
Hiptesis 2:
Ho: b = 0
Ha: b 0
Valor de la tabla: t (1

; n 2)

Valor del estadstico de prueba:

b
sb

ANLISIS DE VARIANZA
El mtodo del ANOVA de la regresin lineal simple plantea la hiptesis nula
si b es igual a cero:
___ 2

Suma cuadrado total

SCT y 2 n y

Suma cuadrado de regresin

SCR b( xy n x y )

Suma cuadrado del error

SCE SCT SCR

Cuadrado medio de regresin

CMR SCR

Cuadrado medio del error

CME

Valor del estadstico

Valor de la tabla

F (1, n 2,1 )

__ ___

SCE
n2

CMR
CME

Si el valor del estadstico es mayor que el valor de la tabla entonces se rechaza la


hiptesis nula.

UCV Lima este

Pgina 157

Mtodos estadsticos

APLICACIN DEL MODELO

Despus de haber analizado la validez del modelo de regresin lineal


calculado de la muestra y comprobado la existencia de regresin lineal en la
poblacin de la cual se ha obtenido la muestra o ms especficamente despus de
haber concluido que el modelo lineal estimado es adecuado para describir la
relacin lineal entre X e Y se puede aplicar esta estimacin del modelo de
regresin, para pronosticar o predecir el valor y para un valor especifico de x.
El primero es estimar el valor medio de todo los valores de y
corresponde al valor x en un intervalo de confianza.

que

El segundo es predecir un solo valor y de todo los valores de y que


corresponde a x y calcular los extremo de esta prediccin.
EJEMPLO APLICATIVO DE ANLISIS DE REGRESIN
Los siguientes datos corresponden a las notas obtenidas en un examen parcial y
final del curso de mtodos estadsticos:
X:PARCIAL
12
10
11
04
09
11
18
15
13
14

Y:FINAL
14
08
11
06
12
15
19
10
12
15

Hallar el grafico de dispersin

Tendencia: lineal positiva


UCV Lima este

Pgina 158

Mtodos estadsticos

Hallar el coeficiente de correlacin

n XY ( X )( Y )

n Y

( Y ) 2 n X 2 ( X ) 2

= 0.7555

Hallar el modelo de regresin lineal (modelo ajustado)


B

n XY ( X )( Y )
n X 2 ( X ) 2

A Y bX

Y = 3.38 + 0.75 X

UCV Lima este

Pgina 159

Mtodos estadsticos

TABLA DE LOS COEFICIENTES DEL MODELO


Coeficientes no
estandarizados

Modelo

Coeficientes
tipificados

Error tp.

Beta

(Constante)

3,377

2,828

X_PARCIAL

,754

,231

,756

P_VALOR

1,194

0,267

3,262

0,011

El coeficiente del examen parcial es significativo

CUADRO DEL COEFICIENTE DE CORRELACIN

Modelo
1

R
cuadrado

,756

,571

R cuadrado Error tp. de la


corregida
estimacin
,517

2,616

Dado que el r = 0.756 se dice que existe relacin lineal positiva entre las notas
del examen parcial y el examen final.

CUADRO DE BONDAD DE AJUSTE DEL MODELO


Modelo
1

Suma de
cuadrados

gl

Media
cuadrtica

P_VAL
OR

Regresin

72,846

72,846

10,643

,011

Residual

54,754

6,844

Total

127,600

Ho: el modelo es no significativo.


Ha: el modelo es significativo.
Decisin: entonces se rechaza Ho.
Conclusin: con un 5% de significancia el modelo resulta ser significativo.

UCV Lima este

Pgina 160

Mtodos estadsticos

EJERCICIOS PROPUESTOS
1) En un estudio del efecto de un componente de la dieta sobre la
composicin de los lpidos del plasma, se obtuvieron los siguientes datos en
una muestra de 8 animales experimentales
X = Medida del componente de la dieta
Y = Medida de la concentracin de lpidos en el plasma

18

38

21

40

28

47

35

54

47

66

33

52

40

59

19

38

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

2) Los datos siguientes muestran la densidad ptica de cierta sustancia a


diferente niveles de concentracin.
X = Nivel de concentracin
Y = Densidad ptica

UCV Lima este

Pgina 161

Mtodos estadsticos

80

0,08

280

0,38

120

0,12

320

0,41

160

0,18

360

0,42

200

0,21

400

0,51

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

3) El administrador de un hospital reuni los siguientes datos sobre el costo


por comida estndar a diferentes volmenes de preparacin.
X = Nmeros de comidas servidas
Y = Costo por comidas
x

30

1,15

35

1,11

40

0,98

45

1,01

50

0,97

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

UCV Lima este

Pgina 162

Mtodos estadsticos

4) Se llevo a cabo un experimento para estudiar la relacin entre una


medicin objetiva de la ansiedad y la frecuencia cardiaca en adulto. Se
obtuvieron los siguientes resultados en los 10 adultos normales.
X = Frecuencia cardiaca por minutos
Y = Medicin objetiva de la ansiedad

50

48

75

36

55

41

80

38

60

45

85

36

65

41

90

30

70

42

95

32

Hallar la covarianza
Hallar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

5) Se reunieron los siguientes datos en un estudio de la relacin entre la


inteligencia y el tamao de la familia.
X = Tamao de la familia
Y = Puntuacin de inteligencia

UCV Lima este

105

101

102

95

104

93

100

97

97

10

88

Pgina 163

Mtodos estadsticos

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

6) Un banco estudia la relacin entre las variables, ingreso y ahorros mensuales


de sus clientes. Una muestra aleatoria de sus clientes revelo los siguientes datos
en dlares:
X:
Y:

350
100

400 450
1105 130

500
160

950
350

850
350

700
250

900
320

600
130

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

7) El gerente de personal de una empresa quiere estudiar la relacin entre el


ausentismo y la edad de sus trabajadores. Si una muestra aleatoria de 10
trabajadores de registro de la empresa revel lo siguientes datos:
Edad:
25
46

58

Ausentismo:
18
12
8

37

55

32

41

50

23

60

15

10

13

16

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

8) Un grupo que vende al menudeo, encarg un estudio para determinar la


relacin entre los gastos de publicad semanal por radio y el monto de las
ventas de sus productos. En el estudio se obtuvieron los siguientes resultados:

UCV Lima este

Pgina 164

Mtodos estadsticos

Gastos:
30
20

40

50

70

60

80

70

80

90

Ventas:
300 250

400

380

550

750

630

930

700

750

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

9) Una empresa agroindustrial quiere determinar la relacin entre cantidad de


fertilizante y produccin de papa por hectrea que produce. Si la muestra del
experimento proporcion los siguientes datos:
Sacos:
3
4

Rendimiento:
45
48
52

10

11

12

55

60

65

68

70

74

76

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

10) Para estudiar la relacin entre el nmero de horas de estudio y


calificaciones finales en una prueba de conocimientos se recopilaron
siguientes datos de una muestra aleatoria de 10 alumnos.
Horas:

14

Calificaciones: 12

16

22

20

18

16

18

16

18 22

13

15

15

17

11

14

16

08

las
los

05

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo

UCV Lima este

Pgina 165

Mtodos estadsticos

BIBLIOGRAFA
1. VILA, Roberto. Estatstica Elemental. 3era. Edicin. Lima. Estudios y Ediciones
R.A. 2002. 224 p
2. CRDOVA Manuel. Estadstica Descriptiva e Inferencial Aplicaciones. Editorial,
Librera Moshera S.R.L. 2008.
3. JHONSON, Robert. Estatstica Elemental. 2da. Edicin. Mxico DF. Editorial
Trillas. 2002. 180 p.
4. MITACC Meza Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.
Editorial San Marcos. 2000
5. MONTGOMERY, M E. y RUNGER, G. Probabilidad y Estadstica Aplicada a la
Ingeniera. 1era. Edicin. Mxico. DF. Mc Graw Hill. 1999. 200 p.
6. WALPOLE, R. [et al. ]. Probabilidad y Estadstica para Ingenieros. 6ta. Edicin.
Mxico DF. Pearson Educativo. 2002. 200 p.

UCV Lima este

Pgina 166

You might also like