You are on page 1of 76

Clase 1 semana 1 y 2

ELEMENTOS DE
ESTADÍSTICA DESCRIPTIVA
Introducción

 La Estadística es una ciencia que


facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso o
evento.
 Nos permite inferir el
comportamiento de sucesos iguales o
similares sin necesidad de que estos
ocurran.
 Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo,
así como realizar proyecciones del
comportamiento del suceso.

 Sólo se realizan los cálculos y el


análisis con los datos obtenidos de
una muestra de la población y no
con toda la población.
 Actualmente el INEC es el encargado de concentrar
y publicar la información estadística del estado y
del país.
Conceptos básicos
 Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
después obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.

 Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
 Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
 Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Al número de integrantes de la población se llama
tamaño de la población y se representa con la
letra N.

Las poblaciones pueden ser finitas o infinitas.


 Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medición de una variable en los
elementos de una población.
 Muestra:
Subconjunto de una población, que intenta reflejar
las características de la población lo mejor posible.
El número de individuos que integran la muestra,
llamado tamaño de la muestra se representa con
la letra n.
 Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
 Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
 Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.

La naturaleza de los datos pueden ser datos


cuantitativos o datos cualitativos.
 Datos Cuantitativos (números):
Valores obtenidos al medir peso,
estatura, temperatura, número
de hijos.

 Datos Cualitativos (categorías):


Se obtienen al calificar la
característica en cuestión como
el sexo, estado civil, grado
máximo de estudios.
 Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre –
mujer, bueno – malo, encendido – apagado).

En la variable CUANTITATIVA se pueden distinguir


dos tipos: continua y discreta.
 Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
 Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
Escalas de Medición
 Escala Nominal

 Escala Ordinal

 Escala de Intervalo

 Escala de Razón
 Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritméticas entre sus valores, pues éstos
son únicamente ETIQUETAS.

Ejemplo: sexo, código postal, estado civil, número


telefónico, número al correr en un maratón, deporte
favorito, carrera a estudiar, etc.
 Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel específico, pero no se pueden hacer
operaciones aritméticas entre ellas.

Ejemplo:
Pésimo – Malo – Regular – Bueno – Excelente
Primaria – Secundaria – Preparatoria - Licenciatura
 Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y además una NOCIÓN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es único, es más bien un
punto de referencia.

Ejemplo: Escalas de temperatura, la edad de la


Tierra, la línea del tiempo de la humanidad.
 Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el cero
absoluto, existe orden, se puede determinar
cuántas veces es mayor uno que otro.

Ejemplo: peso, estatura, edad, distancia, dinero, etc.


Fuentes de información

 Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.

 Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Fuentes de Información

 Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Orden de datos
 La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.

 Hay dos métodos comunes:


• Listado en orden ascendente
• Método de tallo y hojas
Ejemplo
 Considera que la variable de estudio es el peso de
25 estudiantes. Los pesos se encuentran en la
siguiente tabla:

Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden ascendente
 El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)

42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45 55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Método de tallo y hojas

 Si los números de los datos están formados por


dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.
 Datos sin ordenar: Peso de 25 estudiantes (en kg)

4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
52 62 44 50 59
6 2,3,6,3
63 50 56 55 45
57 66 63 51 58
 Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
Doble tallo
 Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos. El
primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.

4 0,2,3,4,4
 El ejemplo anterior 4 5,8,9
queda: 5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
Caso de variables cualitatitivas
 El procedimiento es:

 Se identifican todos los valores diferentes y se


acomodan en columna.

 Se agrega una segunda columna en donde se van


registrando, mediante una línea vertical, la veces
que aparece el valor dado.
Ejemplo
 Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosa


gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuencia
rosa azul blanco azul rosa Azul IIII
gris blanco café negro blanco Blanco IIII II
rosa azul café blanco blanco Café III
gris azul blanco rosa gris Gris IIII
gris blanco café negro verde Negro II
Rosa IIII
Verde I
Tabla de Frecuencia de Datos

 Una vez que se tenga ordenados los datos, se


acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.

 La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
 La frecuencia es el número de veces que aparece
cada dato.

 Hay dos clases de tablas de frecuencias:


 Para datos NO agrupados.
 Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados

 Está formada por dos columnas: una para la


variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
Ejemplo
 Tabla de frecuencias de los pesos en kg de 25
alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
Clase 2 semana 2

 Tablas de frecuencias y organizar datos


 Presentación de diagramas de tallo y hoja y
tablas de conteo
 Taller 2
 Entregar una encuesta elaborada en clases
 Clasificar las variables según el tipo de
variable y realizar algunas presentaciones de
cuadros y gráficas
 Elaborar una base de datos paso a paso y
generar las tablas dinámicas y las gráficas
correspondientes. Trabajar las encuestas
presentadas en excel
Frecuencia relativa y acumulada
 Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia
acumulada “fa”.
 La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es fr = f/n.
 La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Ejemplo
1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 10 63 2 número
0.08 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Total 25 1

Siempre es 1
Intervalo de clase

 En ocasiones es conveniente acomodar los


datos en pequeños grupos de igual tamaño,
llamados intervalos de clase.
 El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase = Límite inferior + límite superior
2
 El tamaño del intervalo se obtiene mediante
la diferencia de los límites superior e inferior.
Ejemplo

Límite inferior Límite superior Lím inf + Lim sup


2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65
Límite verdadero del intervalo
 Frontera de clase o límite verdadero del intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
Tabla de intervalos con
límites verdaderos
 Usando símbolos de  Usando paréntesis
Está incluido
y
No está incluido
Está incluido No está incluido
desigualdad corchetes
Intervalo de Punto Intervalo de Punto
clase medio “xi” clase medio “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
El tamaño del intervalo es de 5
 Si por alguna razón no es fácil decidir el ancho del
intervalo y el número de ellos, se pueden utilizar las
siguientes fórmulas:
 K = 1 + 3.3 log (n)
 Donde K = número aproximado de clases

n = número de datos.
 Amplitud de los intervalos = Rango / K
 Donde Rango = diferencia entre el dato mayor
y el dato menor.
Ejemplo
 Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
 Y la amplitud de los intervalos sería:
Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.
Aproximadamente 5 unidades es la amplitud de los
intervalos.
Tabla de distribución de
frecuencias para datos agrupados
 Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para
cada uno de los intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar

40 1 55 2 Intervalo de Punto medio f


42 1 56 2 clase “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
 Se agregan las columnas de frecuencia relativa “fr”
y frecuencia acumulada “fa”:
Intervalo Punto f fr Fa 2/25
de clase medio “xi”
4/25
38 – 42 40 2 0.08 2
8/25
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
 Por último se agregan las columnas:
 Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
 Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a un
dato dado.
 Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
Tablas de frecuencias absoluta, 0.08 x
relativa y acumulada 100

0.08 x 2/25
100
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
Gráfica de Datos
 Existen dos tipos de gráficas mas usuales:
 Polígono de Frecuencias
 Histograma

 Otros gráficos:
 Gráfica de barras
 Pictograma
 Gráfico Circular o de pastel.
Polígono de Frecuencias
 Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.

 El eje “x” representa el dato “xi”


y el eje “y” las frecuencias.
Ejemplo

9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio f 3
clase “xi” 2
38 – 42 40 2 1
0
43 – 47 45 4
35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
 El eje “y” puede ser sustituido por las frecuencias
relativas o porcentuales.
Polígono de Frecuencia Relativa
0.35

0.3

0.25
fr 0.2

0.15

0.1

0.05

0
35 40 45 50 55 60 65 70
xi
Polígono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi
Histograma
14

 Es la representación gráfica de 12

10

los datos mediante una sucesión 6

de rectángulos. 0
0.95 2.95 4.95

 Está formado por rectángulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
 En el eje “x” estarán los límites verdaderos, los
puntos medios y en el eje “y” las frecuencias.
Intervalo de Punto medio f

Ejemplo clase
38 – 42
“xi”
40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3
Histograma
63 - 68 65 3
9
Total 25
8
7
6
5
f
4
3
2
1
0
35 40 45 50 55 60 65
xi
 También podemos usar la frecuencia relativa y la
frecuencia porcentual.
Histograma con frecuencias relativas
0.35
0.3
0.25
fr
0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65
xi
Histograma con frecuencias porcentuales
35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi
Pirámide Poblacional
 Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
 Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.

 En el eje “x” estarán los puntos medios y en el


eje “y” las frecuencias acumuladas.
Clase 3 semanas 4 y 5

 Continuación con creación de base de


datos y manipulación de la información
Ejemplo

Intervalo Punto f fr fa
de clase medio “xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi
 Usando la frecuencia acumulada y la frecuencia
porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0.9 0.88

0.8 0.76
0.7
0.6 0.56
fra 0.5
0.4
0.3
0.24
0.2
0.1 0.08

0 0

35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi
Gráfico Circular
 También es llamado gráfico de pastel.

 Sólo se representan datos de frecuencias relativas


o frecuencias porcentuales.

 Se debe dividir el área del círculo de manera


proporcional a las frecuencias. 13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%
 Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
0.08 x
360°
Intervalo Punto medio f fr (fr ) (360°)
de clase “xi” 0.16 x
38 – 42 40 2 0.08 28.8° 360°

43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2°
53 – 57 55 5 0.20 72°
58 – 62 60 3 0.12 43.2°
63- 68 65 3 0.12 43.2°
Total 25 1 360°
Gráfico Circular 40
8%
60
12% 65
12% 45
16%

55
20% 50
32%
Ejemplo 2

Color Frecuencia Conteo Color de Playera


Azul IIII 4 Azul Blanco Café Gris
Negro Rosa Verde
Blanco IIII II 7 4%
Café III 3 16% 16%
Gris IIII 4 8%
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
Otros Gráficos
 La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
 La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos. Frecuencia absoluta
60

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Carrera Alumnos
Elección de Carrera
Medicina 8
Mecánica 11 11 11
Civil 8 8 8
6
Agronomía 3 3 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
Pictograma
 Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.
Clase 4, semanas 5, 6 y 7

 Talleres de repaso del contenido


estadístico de
 Estadística
 Creación de base de datos
 Codificación y captura
 Elaboración de un informe estadístico
con los pasos para realizar una
investigación
Semana 8 Examen de la primera
parte del curso (40%)
 Se evaluaran contenidos teóricos y
prácticos realzados y presentados en
clases.
Medidas de tendencia central

INICIO DE LA  Para datos no agrupados


 Media mediana y
 Moda
Segunda
Parte (60%)
 Talleres prácticos en clases

Clase 5
Medidas de dispersión para datos
no agrupados
continuación  Varianza
 Desviación estándar
 Coeficiente de variación

You might also like