Professional Documents
Culture Documents
INTRODUCCIN INTRODUCCIN CONCEPTOS BASICOS CONCEPTOS BASICOS ORGANIZACIN DE DATOS ORGANIZACIN DE DATOS Profesor del curso: Ing. Celso Gonzales Profesor del curso: Ing. Celso Gonzales
INTRODUCCION
OBJETIVOS
Comprender qu es y porqu se estudia la estadstica. Comprender los conceptos bsicos de la estadstica. Explicar lo que significan estadstica inferencial. estadstica descriptiva y
Qu es estadstica?
Recolecta Organiza Presenta Analiza interpreta
TIPOS DE ESTADISTICA
RAMAS DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA
ESTADSTICA INFERENCIAL
SE OCUPA DE LA COLECCIN Y CLASIFICACIN DE INFORMACIN, DE SU RESUMEN EN CUADROS Y GRFICOS ADECUADOS QUE RESUMAN EN FORMA APROPIADA LA INFORMACIN CAPTADA.
SE OCUPA DE LOS PROCESOS DE ESTIMACIN, ANLISIS Y PRUEBA DE HIPTESIS, CON ELPROPSITO DE LLEGAR A CONCLUSIONES QUE BRINDEN UNA ADECUADA BASE CIENTFICA PARA LA TOMA DE DECISIONES TOMANDO COMO BASE LA INFORMACIN CAPTADA POR LA MUESTRA.
Plantear hiptesis sobre una poblacin Decidir qu datos recoger (diseo de experimentos)
Qu individuos pertenecern al estudio (muestras) Qu datos recoger de los mismos (variables)
Describir (resumir) los datos obtenidos Realizar una inferencia sobre la poblacin Cuantificar la confianza en la inferencia
Nivel de confianza Margen de error:
CONCEPTOS BSICOS
Poblacin Muestra Individuo o unidad elemental Observacin Variable Parmetro Estadstico
POBLACIN Y MUESTRA
Poblacin Conjunto de observaciones o datos obtenidos de una medicin, conteo o cualidad de ciertos caracteres de los mismos. Muestra Deber ser representativo
Unidad elemental
Todo elemento que est afectado por la caracterstica o factor que se desea estudiar. Ejemplo: Se desea hacer un estudio sobre el ingreso familiar de Lima Metropolitana Identifique: Poblacin, una posible muestra, la caracterstica en estudio y la unidad elemental.
Observacin
Dato o registro realizado, producto de la apreciacin de una caracterstica en una unidad elemental. De una observacin para el ejemplo anterior.
EJEMPLO1 Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferan esta marca. a. Qu constituye la muestra?. b. Qu constituye la poblacin?. c. Cul es la proporcin, dentro de la muestra, de las amas de casa que prefieren la marca del detergente?
Variables
Son las caractersticas que se desea apreciar de los elementos de la poblacin.
CLASIFICACIN DE VARIABLES
CUALITATIVAS
CUANTITATIVAS
Atributos
Numrico
Ordinal Discreto Continuo
Nominal
TIPOS DE VARIABLES
Cualitativas Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No) Ordinales: Si sus valores se pueden ordenar Grado de satisfaccin, Intensidad del color Cuantitativas o Numricas Discretas: Si toma valores enteros Nmero de hijos, Nmero de desempleados Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, ingreso mensual,
EJEMPLO2
Clasificar cada una de las siguientes variables: a. Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. b. Tiempo que requiere un estudiante para responder a un examen. c. Llamadas que llegan a la central telefnica de la USB en un da. d. Preferencia por cierta marca de refresco. e. Sexo de las estudiantes que toman el curso de estadstica en el semestre. f. Nmero de acciones vendidas en un da en la Bolsa de Valores.
Parmetro
Es una funcin de todas las observaciones de una poblacin ( ) MEDIDA USADA PARA DESCRIBIR UNA VARIABLE DE UNA POBLACION El parmetro resume la informacin contenida en las observaciones que comprenden a una poblacin, por lo que su valor es nico y generalmente desconocido y por tato debe ser ESTIMADO.
Parmetro
La media
La varianza 2 Proporcin
x1 + x2 + ...+ xN = N
p
Estadstico o estimador
Es una funcin de los valores muestrales y que no depende de parmetro alguno. Se caracterizan porque pueden tomar valores diferentes de muestra a muestra.
= f (x1, x2,...,xn )
x1 + x2 + ...+ xn X= n
ORGANIZACIN DE DATOS
VARIABLE CUALITATIVA
Para representar grficamente la distribucin de frecuencias de una variable cualitativa se utilizan las barras y los sectores circulares. Nota Si trabajamos con variables nominales las categoras pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categoras debern ser colocadas en orden
EJEMPLO: En una planta embotelladora se registraron 54 accidentes y de acuerdo con la parte del cuerpo lesionada, dedos (D), ojos (O), brazo (B), y piernas (P); se registraron los datos (cuadro 1). Se pide organizar los datos.
CUADRO 1:
D D D O D P D D B D D P B B B P D P B D D B B P D D B P P O O D D D B O B D D B O D P O D B O P D B P B P D
NMERO DE ACCIDENTES 14 22 7 11 54
Nmero de accidentes
10
Parte Lesionada
Fuente: Elaborado por el Departamento de Personal. Julio del 2005
OJO ( 7, 13.0%)
Si adems de registrar la parte lesionada se registra el sexo de los trabajadores se podra tener un grfico de este tipo.
Registro de accidentes segn el tipo de lesin y sexo
15 Hombre
Nm ero de trabajadores
Mujer 10
0 B D O P
LESION
Fuente: Departamento Mdico Julio del 2005
ORGANIZACIN DE DATOS
VARIABLE CUANTITATIVA DISCRETA
Variable X1 X2 Xn
Frecuencia f1 f2 fn n
Ejemplo Construir la distribucin de frecuencias del nmero de trabajadores que se ausentaron en 20 das laborales:
2 3 3 3 1 2 2 3 2 3 1 1 4 2 3 2 1 0 2 4
Ausencias de Trabajadores 0 1 2 3 4
N de das
Porcentajes
1 4 7 6 2 20
Distribucin de Frecuencia del nmero de trabajadores que sea ausentaron por da.
7
Nmero de trajadores
6 5 4 3 2 1 0 0 1 2 3 4
50%
Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?
2 hijos
MEDIDAS DE VARIABILIDAD
Rango Rango intercuartil Variancia Desviacin estndar Coeficiente de variabilidad
ORGANIZACIN DE DATOS
VARIABLE CUANTITATIVA CONTINUA
En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana fue registrado durante 50 das. A continuacin se transcriben los datos, aproximados a dcimas de minuto:
20,8 25,3 23,7 21,3 19,7 22,8 20,7 20,3 21,5 24,2 21,9 22,5 23,6 23,1 23,8 22,0 21,2 19,0 19,9 20,7 20,7 23,8 25,1 24,2 23,8 20,9 23.3 25,0 24,1 24,3 25,0 20,9 19,5 19,8 21,1 22,2 22,9 24,1 23,9 20,9 22,8 23,5 24,2 22,8 21,6 20,1 19,5 21,8 23,9 22,7
a. Construya con los datos una tabla de distribucin de frecuencia, usando la regla de sturges. b. Construya un polgono de frecuencias. c. Construya una ojiva. d. Por medio de la ojiva estime que porcentaje de las veces la primera plana del peridico puede imprimirse en menos de 24 minutos.
PROCEDIMIENTO Calcular el rango (R) o recorrido, el cual se define de la siguiente manera: R = Obs. mxima Obs. Mnima R = 25.3 - 19.0 = 6.3 Determine el nmero de intervalos (k) K = 1 + 3.3 log (n) (Frmula de Sturges) K = 1 + 3.3 log (50) = 6.607 = 7 (entero) (Redondeo simple)
Determinar del tamao del intervalo TIC (Redondeado por exceso) Se redondea sugn el nmero de decimales que se tiene en la muestra
Elabore la tabla de frecuencia segn la informacin anterior donde: fi= Frecuencia absoluta Fi= Frecuencia acumulada absoluta fri= Frecuencia relativa=fi/n Fri= Frecuencia acumulada relativa
f
i =1
=n
fr
i =1
=1
Fi =
f
j =1
Fri = fr j = Fi / n
j =1
Marca de clase
X i =
LI i + LS i 2
Distribucin de frecuencias del tiempo que tardan en imprimir la primera plana de un diario
Tiempo (minutos) [19.0-19.9> [19.9-20.8> [20.8-21.7> [21.7-22.6> [22.6-23.5> [23.5-24.4> [24.4-25.3] fi 5 6 9 5 7 14 4 50 fri 0.10 0.12 0.18 0.10 0.14 0.28 0.08 1 Fi 5 11 20 25 32 46 50 Fri 0.10 0.22 0.40 0.50 0.64 0.92 1.00 Xi 19.45 20.35 21.25 22.15 23.05 23.95 24.85
cuantitativos
Agrupados
en
HISTOGRAMA DE FRECUENCIA
Distribucin del tiempo que se tardan en imprimir la primera plana del diario 14 12 10 8 6 4 2 0
Nmero de das
19.0
19.9
20.8
23.5
24.4
25.3
POLIGONO DE FRECUENCIAS
Distribucin del tiempo que se tardan en imprimir la primera plana del diario 14 12 10 8 6 4 2 0
POLIGONO
Nmero de das
19.45
20.35
21.25
22.15 Tiempo
23.05
23.95
24.85
OJIVA
OJIVA 60 50 N Acum ulado de dias 40 30 20 10 0 19 19.9 20.8 21.7 22.6 23.5 24.4 25.3 Tiempo(en minutos)
EJERCICIO Para evaluar la viabilidad de un proyecto de reforestacin de una zona sometidas a estrs turstico, para el que se ha solicitado una subvencin publica, se analiz la composicin en mg/cm3 de desechos orgnicos del territorio. Los datos obtenidos fueron:
Composicin (mg/cm3) 8.2 9.2 9.4 10.8 10.8 11.1 11.9 12.9 12.9 14 14.3 14.4 15.1 15.1 15.3 15.8 15.9 16.9 18.2 18.4 18.6 18.8 19.7 20.3 20.3 20.3 20.4 20.7 20.8 21 21.4 22.2 22.5 23.2 25.8
A. Construir la tabla de frecuencias y representar la informacin grficamente. B. A partir de la tabla de frecuencias interprete: f3 y 1-Fr2 C. Entre qu niveles de composicin se encuentra aproximadamente el 51,4% de las observaciones con menores niveles registrados?.
Composicin [8.2 - 11.2> [11.2 - 14.2> [14.2 - 17.2> [17.2 - 20.2> [20.2 - 23.2> [23.6 - 26.2>
Nmero de observaciones 6 4 8 5 10 2
Fi 6 10 18 23 33 35
EJERCICIO Para los artculos anteriores se tienen las siguientes distribuciones de los precios (en dlares) en la primera semana de agosto y en la primera semana de setiembre del 2005.
CANTIDAD DE ARTICULOS PUNTOS MEDIOS 61 64 67 70 73 76 79 AGOSTO 0 1 2 4 6 4 3 SETIEMBRE 3 4 6 4 2 1 0
a) Grafique las dos distribuciones anteriores en un slo grfico donde se aprecien el comportamiento de las mismas y calcule el promedio y la desviacin estndar de la distribucin de agosto b) Realice un comentario segn lo observado en el grfico anterior
tallo
1 19 0 6 19 55789 8 20 13 15 20 7778999 18 21 123 22 21 5689 24 22 02 (6) 22 578889 20 23 13 18 23 56788899 10 24 112223 4 24 4 25 0013
hojas
6 datos entre 22.5 y 22.9 y uno de ellos es la mediana 10 datos mayores e iguales que 24.1