You are on page 1of 36

Estadisticas Descriptiva.

3 Unidad:

Estadstica:

Es la ciencia que estudia los medios para derivar informacin vlida a partir de un conjunto de datos. Es decir, estudia los mecanismos para la obtencin de datos as como su manipulacin y anlisis. El estudio de la estadstica se ha concretado primordialmente en el anlisis de datos y su aplicacin en la toma de decisiones, lo que ha permitido dividir a la estadstica en:

Estadstica descriptiva Inferencia estadstica (estadstica inductiva o estadstica analtica).

Estadsticas Descriptivas:

Es el proceso que se relaciona con los mtodos y/o tcnicas para la recopilacin, organizacin y anlisis de un conjunto de datos cuantitativos, con el objeto de describir en forma apropiada las diversas caractersticas de dicho conjunto.

1. Estadsticas Descriptiva.
DEFINICIONES: POBLACIN. Es la totalidad de elementos de un grupo dado que posee una caracterstica delimitada para el alcance de una investigacin.

MUESTRA. Se denomina muestra a una porcin de datos representativos de una poblacin

Tipos de Variables

CUALITATIVAS, tambin llamadas CARACTERES, VARIABLES CATEGRICAS o ATRIBUTOS, que son aquellas que no necesitan nmeros para expresarse. Por ejemplo, el sexo de una persona es una variable cualitativa y varn o mujer son sus nicas modalidades.

Ordinales: que son las que teniendo ms de dos modalidades tienen establecido un orden natural entre las mismas. Moderado, Grave, Leve. Puras: no tienen un orden natural prestablecido entre sus modalidades. Nacionalidad o Grupo Sanguneo. Dicotmicas: son las que tiene slo dos respuestas. Ejemplo si o no.

CUANTITATIVAS o NUMERICAS, que son aquellas que necesitan nmeros para ser expresadas

Discretas: Toman slo valores enteros Continuas: Toman cualquier valor numrico. Enteros o Decimal.

Ejemplo de lo visto:

En una institucin educativa se quiere saber la ocupacin de los egresados de la ltima dcada. Para esto se convoca a una reunin de egresados y de los asistentes, se encuesta a diez egresados de cada ao. Determina la poblacin y la muestra:
Poblacin: Todos los egresados de la ltima dcada. Muestra: Los 100 estudiantes seleccionados, 10 de cada promocin.

Tabla de distribucin de frecuencias

Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla, que denominaremos DISTRIBUCIN DE FRECUENCIAS, en la que cada valor de la variable o clase se le asocian el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc.

FRECUENCIAS: ABSOLUTAS O PORCENTUALES

En caso de que las variables estn al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas y acumuladas porcentuales.

Tabla de distribucin de frecuencias

Definiremos como frecuencia de un dato el nmero de veces que este aparece en el colectivo. Siendo N la suma de las respectivas frecuencias de cada dato (N=Xi). Este N ser denominado como frecuencia total. A efectos prcticos, asumiremos las siguientes definiciones de frecuencias: a) frecuencias absolutas : es el nmero de veces que aparece dicho valor de la variable y se representa por fi.

Tabla de distribucin de frecuencias

b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fri

Tabla de distribucin de frecuencias

c) frecuencias absoluta acumulada: es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable, se puede acumular, en la tabla estadstica) en orden ascendente (fa) o descendente (fa)

Tabla de distribucin de frecuencias

d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (N).

Ejemplo: 2

En este segundo Verificaremos cuantas personas visitaron la biblioteca nacional el mes pasado. En un total de 500 personas entrevistada se obtiene lo siguientes: con las frecuencias absolutas, que son el nmero de personas cuyo nmero de visitas es uno determinado: que 210 sea la frecuencia absoluta del valor 0 quiere decir que de entre las 500 personas consideradas en el estudio 210 no han ido ninguna vez a la biblioteca el mes pasado, es decir, que el valor de la variable es "cero" para ellas; esta frecuencia absoluta 210 supone el 42% de 500, por lo que 0.42 42% es la frecuencia relativa del valor 0 de la variable.

Ejemplo 2:
Valores Frec. absoluta Frec. relativa Frec. absol. acumulativa 210 Frec. relat.acumulativa 42.0%

210

42.0%

1
2 3 4 5 Totales

178
68 24 14 6 500

35.6%
13.6% 4.8% 2.8% 1.2% 100%

388
456 480 494 500

77.6%
91.2% 96.0% 98.8% 100.0%

GRFICOS ESTADSTICOS

Las distribuciones de frecuencias se presentan en tablas como las anteriores, y/o bien en grficas. La representacin grfica se utiliza para facilitar al lector la comprensin de los resultados, pero no aade ninguna informacin sobre la que contendra una tabla de frecuencias; el objetivo de las grficas es que la informacin impacte directamente al lector y que se exprese el perfil de la distribucin, pero no debe olvidarse el rigor en aras de la esttica: las grficas deben reflejar fielmente lo que tratan de representar, fundamentalmente las frecuencias de cada modalidad o valor. Por ello la regla fundamental para la construccin de una grfica es que:

GRFICOS ESTADSTICOS

Diagrama de barras: Se utilizan rectngulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato.

GRFICOS ESTADSTICOS

Grfica de Torta: Se forma al dividir un crculo en sectores circulares de manera que:

a) cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa; y b) la unin de los sectores circulares forma el crculo y la suma de sus porcentajes es 100.

GRFICOS ESTADSTICOS

Ojiva de Frecuencias Acumuladas: Una grfica de distribucin de frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se trazan los lmites reales superiores contra las frecuencias acumuladas.

PARAMETROS DE UNA DISTRIBUCION

Se trata de resumir ms la informacin de una tabla o de una grfica, y de encontrar algunos valores lo ms simples posible que nos permitan dar informacin sobre la muestra o comparar dos muestras entre s.

PARAMETROS DE UNA DISTRIBUCION

Para hacer ese resumen o informacin de los datos hay tres enfoques fundamentales:
En primer lugar, dar un valor lo ms representativo posible de todos los valores de la muestra, que no sea, por tanto, ni de los ms bajos ni de los ms altos. As se crean las medidas parmetros de centralizacin, tendencia central o posicin central.

1.

PARAMETROS DE UNA DISTRIBUCION


1.

En segundo lugar, y como complemento a lo anterior, dar una valoracin de hasta qu punto los datos se parecen entre s o bien estn muy diferenciados (dispersos); adems, cuanto ms se parezcan entre s los valores que nos salen, ms se parecern al representante o parmetro de centralizacin que elijamos, y mejor sera ste. Por todo esto conviene medir las diferencias internas de los datos mediante las medidas parmetros de dispersin
Finalmente, en tercer lugar, se puede tambin tratar de medir qu valor supera a una cierta porcin o proporcin de valores, o lo que es lo mismo, tratar de informar sobre la distribucin de la variable diciendo a cuntos de sus valores supera uno dado. Para ello se usan los cuantiles como medidas parmetros de posicin.

2.

Ejemplo:

Definiremos a continuacin los ms importantes entre todos los parmetros de estos tres tipos y para ilustrar su clculo usaremos el ejemplo siguiente, donde los datos son el nmero de hermanos (excluido l mismo) de una muestra de 13 nios; presentamos los datos ordenados de menor a mayor para mejor comprensin, pero en principio los datos nos vendran en cualquier orden. Supongamos que son los siguientes: 0 3 0 4 0 5 1 7 1 1 2 2

Primer grupo: PARAMETROS DE CENTRALIZACION.


Entre los parmetros de centralizacin, tambin llamados de tendencia central o de posicin central, tres son las definiciones destacables: Moda: Es el valor que tiene mayor frecuencia absoluta. Se puede hallar la moda para variables cualitativas y cuantitativas. Se representa por Mo
Ejemplo: Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Primer grupo: PARAMETROS DE CENTRALIZACION.

Mediana: Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se puede hallar slo para variables cuantitativas. La mediana se representa por Me.
Ordenamos los datos de menor a mayor. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5

1. 2.

1.

Primer grupo: PARAMETROS DE CENTRALIZACION.


Media aritmtica: es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos. El smbolo de la media aritmtica es X Ejemplo: Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

X: 480 = 80 kg. 6

Segundo grupo: PARAMETROS DE DISPERSION

Por su parte, las medidas de dispersin se basan en la idea de medir las diferencias entre unos datos y otros midiendo las diferencias de cada dato con la media, esto es, usando las desviaciones; sin embargo, como stas siempre suman cero, es preciso considerar su valor absoluto o su cuadrado para que ello no ocurra (seran ya todas positivas). Las ms importantes medidas de dispersin son las siguientes:

Segundo grupo: PARAMETROS DE DISPERSION

Desviacin Media: (DM)

Equivale a la divisin de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmtica y el nmero total de datos.

Recomendar:
Primero Calcular Desviacin de una variable: x x Luego sume cada una de los datos, y los divide por n, y as tendremos Desviacin media. (ejemplo en clases)

Segundo grupo: PARAMETROS DE DISPERSION

Varianza: (2) Es la media de las diferencias


con la media elevadas al cuadrado.

Recomendar:

1. Calcula la media (el promedio de los nmeros) 2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Ahora calcula la media de esas diferencias al cuadrado. (ejemplo en clases)

Segundo grupo: PARAMETROS DE DISPERSION

Desviacin Estndar: (s) Expresa el grado de dispersin de los datos a x. Se calcula de la siguiente forma:

Ejemplo en clases.

You might also like