You are on page 1of 60

PROCESO DE INVESTIGACIN EPIDEMIOLGICA

Qu estudiar y para qu?

Indicadores
Qu datos recolectar?
Fuentes de
informacin
Dnde y cmo recolectarlos?

Cmo procesarlos? Estadstica

Cmo interpretarlos?
La estadstica es la ciencia
que se ocupa de resumir y analizar los
datos sujetos a variaciones aleatorias.

Last 1988
BIOESTADSTICA

PERMITE EXPRESAR
NUMRICAMENTE LAS
OBSERVACIONES REALIZADAS

Estadstica Descriptiva Estadstica Inferencial


ESTADSTICA DESCRIPTIVA

LA ESTADSTICA DESCRIPTIVA ES LA PARTE DE LA


ESTADSTICA QUE INFORMA ACERCA DE LAS
CARACTERSTICAS DE UNA DISTRIBUCIN O
CONJUNTO DE CASOS. PARA ELLO SE VALE DE
DIVERSAS MEDIDAS DE ANLISIS DE DATOS.
ESTADSTICA INFERENCIAL

La estadstica inferencial estudia como sacar conclusiones


generales para toda la poblacin a partir del estudio de
una muestra, y el grado de fiabilidad o significacin de
los resultados obtenidos.
CONCEPTOS

Poblacin:
Conjunto de todos los elementos a los que se
somete a un estudio estadstico. A cada uno de los
elementos que componen la poblacin de los denomina
individuo o unidad estadstica.

Muestra:
Conjunto representativo de la poblacin de
referencia
CONCEPTOS
Valor
Es cada uno de los distintos resultados que se
pueden obtener de un estudio estadstico.

Ej.: si lanzamos una moneda 5 veces los valores sern


cara y cruz.
CONCEPTOS

Variable:
Es lo que est siendo observado y medido.
DATOS
UN DATO ES EL VALOR QUE ADOPTA LA VARIABLE. LOS DATOS QUE RECOLECTAREMOS PARA
NUESTRA INVESTIGACIN DEPENDEN DE LAS VARIABLES QUE ESCOJAMOS
SON CONJUNTOS NUMEROSOS DE INFORMACIN QUE SE ANALIZAN GRUPALMENTE Y NO
EN CADA CASO EN PARTICULAR.
VARIABLE
UNA VARIABLE PUEDE SER DEFINIDA COMO CUALQUIER CUALIDAD DEL ORGANISMO,
GRUPO O SITUACIN CAPAZ DE ADOPTAR VALORES DIFERENTES EN UN MISMO
INDIVIDUO O ENTRE INDIVIDUOS.
LAS VARIABLES A ESTUDIAR SE SELECCIONAN SOBRE LA BASE DE SU RELEVANCIA PARA LOS
OBJETIVOS DE LA INVESTIGACIN
EJEMPLO

Si desea estudiar el estado


dentario de un individuo..

Podra utilizar como indicador el CPOD

La variable sera: estado dentario

El indicador sera el CPOD

El dato sera 8
TIPOS DE VARIABLES Y FORMAS DE CLASIFICACIN

SEGN LA FUNCIN QUE CUMPLAN EN LA HIPTESIS


SEGN LA FORMA DE MEDIR
SEGN LA PREGUNTA QUE RESPONDEN EN EL ESTUDIO
Las categoras deben cumplir necesariamente con
dos requisitos, ser:
Exhaustivas Excluyentes
si las categoras de las si una unidad de anlisis pueda
variables abarcan todos los ubicarse en una y slo en una
casos que puedan presentarse, de las categoras. No debe
de modo que ninguna unidad
de anlisis sea dejada de darse la posibilidad de inclusin
lado por no poder ubicarse en de una respuesta en dos
alguna alternativa. categoras distintas.
SEGN LA FUNCIN QUE CUMPLAN EN LA HIPTESIS

VARIABLES DEPENDIENTES: AQUELLA VARIABLE QUE EL INVESTIGADOR EST INTERESADO EN


COMPRENDER, EXPLICAR O PREDECIR

VARIABLES INDEPENDIENTES: SON AQUELLAS QUE UTILIZAMOS PARA EXPLICAR A LA PRIMERA

LA O LAS CAUSAS SERN VARIABLES INDEPENDIENTES Y EL EFECTO SER LA VARIABLE DEPENDIENTE


SEGN LA PREGUNTA QUE RESPONDEN EN EL
ESTUDIO

QUINES?: VARIABLES DE PERSONA ESTABLECER EL SEXO DE LAS PERSONAS AFECTADAS, SU


EDAD, PROFESIN, INGRESOS, HBITOS ALIMENTARIOS

CUNDO?: VARIABLES DE TIEMPO - EL TIEMPO DE CALENDARIO ES EL QUE MS A MENUDO SE


UTILIZA, COMO EN LOS ESTUDIOS ANUALES DE MORTALIDAD (DEL 1 DE ENERO AL 31 DE DICIEMBRE
DEL AO EN CURSO)

DNDE?: VARIABLES DE LUGAR DOMICILIO Y ZONA DE RESIDENCIA DE LAS


PERSONAS AFECTADAS.
VARIABLES UNIVERSALES
EDAD SIEMPRE QUE DESEE REALIZAR UNA INVESTIGACIN DEBE CONSIDERAR LA DESCRIPCIN DE ESTA
VARIABLE

SEXO AL IGUAL QUE LA EDAD, EL SEXO ES OTRA VARIABLE QUE SE DEBE CONSIDERAR. CASI TODAS LAS
ENFERMEDADES OCURREN DE FORMA DIFERENTE DE ACUERDO AL SEXO DE LAS PERSONAS

NIVEL SOCIOECONMICO EL NIVEL SOCIOECONMICO HACE ALUSIN, FUNDAMENTALMENTE, A LOS


INGRESOS PERCIBIDOS POR EL INDIVIDUO O EN EL GRUPO FAMILIAR ASOCIADA A MUCHAS Y DIVERSAS
SITUACIONES DE SALUD, TALES COMO LA ALIMENTACIN, LA EXPOSICIN A FACTORES TXICOS
AMBIENTALES, EL ACCESO A SERVICIOS DE SALUD, EDUCACIN, ETCETERA

GRUPO TNICO Y CULTURAL EL GRUPO TNICO Y CULTURAL SE REFIERE AL CONJUNTO DE


PERSONAS QUE GUARDAN SIMILITUD RESPECTO DE LAS COSTUMBRES (RELIGIN, HISTORIA, HBITOS
DIETTICOS, ETC.) Y TAMBIN A LA HERENCIA BIOLGICA
OPERACIONALIZACION DE LAS VARIABLES

OPERACIONALIZAR UNA VARIABLE ES SIMPLEMENTE DEFINIR LA MANERA EN


QUE SE OBSERVAR Y MEDIR CADA VARIABLE DEL ESTUDIO Y TIENE UN
SENTIDO PRCTICO FUNDAMENTAL.
NO HAY UN NMERO EXACTO DE VARIABLES A CONSIDERAR EN UNA
INVESTIGACIN
SEGN LA FORMA DE MEDIR
Cualitativas Cuantitativas
Son caractersticas o cualidades Se expresan mediante nmeros
que no pueden ser medidas por lo que se pueden
con nmeros realizar operaciones aritmticas
ESCALA ESCALA ESCALA ESCALA
NOMINAL ORDINAL DISCRETA CONTINUA
no numricas no numricas numrica numrica
no admiten un en las que existe no admite valores admite valores
criterio de orden un orden intermedios comprendidos
entre dos entre dos
valores especfico nmeros
EJEMPLOS
Estado civil; sexo; Puestos Numero Altura de
condicin de Deportivos; de hermanos; 5 amigos 1.73,
fumador Indice Gingival; CPOD 1.82, 1.77,
INTC 1.69, 1.75

DATOS CATEGRICOS DATOS NUMRICOS


MEDICIN DE LAS VARIABLES
CUALITATIVAS
ESCALA NOMINAL SE USA PARA LA FORMA MS SIMPLE DE MEDICIN, CUANDO LOS DATOS
SE DISTINGUEN POR UN NOMBRE QUE EXPRESA UNA CUALIDAD, CATEGORA O ATRIBUTO. AL
UTILIZAR ESTE TIPO DE ESCALA, SIMPLEMENTE, SE CUANTIFICA LA CANTIDAD DE DATOS QUE
CORRESPONDEN A CADA UNA DE LAS CATEGORAS DE LA VARIABLE

ESCALA ORDINAL PERMITE ESTABLECER UNA RELACIN DE "ORDEN" ENTRE LOS DATOS QUE
PERTENECEN A DISTINTAS CATEGORAS. LA ESCALA ORDINAL PERMITE CLASIFICAR LOS DATOS
DE ACUERDO A SU POSICIN RELATIVA RESPECTO DE OTROS, EN FUNCIN DE UNA VARIABLE
DETERMINADA
MEDICIN DE LAS VARIABLES
CUANTITATIVAS
ESCALA NUMERICA
DISCRETA, CUANDO LOS VALORES QUE SE OBTIENEN SLO PUEDEN SER NMEROS ENTEROS
Y SE ORIGINAN DE RECUENTOS. POR EJEMPLO, NMERO DE HIJOS DE UNA PERSONA

CONTINUA, CUANDO LOS VALORES QUE SE OBTIENEN PROVIENEN DE MEDICIONES Y PUEDEN


ADOPTAR UN INTERVALO DE VALORES CONTINUO E ININTERRUMPIDO, RESTRINGIDO SLO
POR EL GRADO DE EXACTITUD DEL INSTRUMENTO DE MEDICIN. POR EJEMPLO, EL PESO
DNDE RECOLECTAR DATOS
FUENTES SECUNDARIAS O DOCUMENTALES, DE LAS QUE OBTENDREMOS DATOS YA "EXISTENTES" Y
QUE SON ELABORADAS POR OTRAS PERSONAS O INSTITUCIONES CON FINES DIFERENTES A LOS
PLANTEADOS PARA UNA DETERMINADA INVESTIGACIN

ESTADSTICAS HOSPITALARIAS.

ESTADSTICAS VITALES ELABORADAS POR LA DIRECCIN NACIONAL DE ESTADSTICAS DE SALUD CON DATOS
SOBRE NACIMIENTOS, MATRIMONIOS Y DEFUNCIONES PROVISTOS POR EL REGISTRO CIVIL

FUENTES PRIMARIAS O DE RECOLECCIN DIRECTA, CONSTITUIDAS POR EL CONJUNTO DE DATOS


OBTENIDOS POR MEDIO DE DIFERENTES MTODOS "PLANEADOS Y PROVOCADOS POR EL MISMO
INVESTIGADOR DE ACUERDO A LOS FINES DE SU ESTUDIO"
CMO RECOLECTAR LOS DATOS

LA OBSERVACIN: BAJO ESTE NOMBRE SE INCLUYE EL USO DE TCNICAS QUE VAN DESDE LA SIMPLE OBSERVACIN A
OTRO TIPO DE MEDICIONES QUE PUEDEN REALIZARSE TANTO IN VIVO (MEDICIN DE LA PRESIN ARTERIAL) COMO IN
VITRO (EN EL LABORATORIO).

LOS REGISTROS: ES UN MTODO DE RECOLECCIN DE DATOS SISTEMTICO, PERIDICO, CONTINUO Y EN ALGUNAS


OCASIONES PERMANENTE. ESTE MTODO DE RECOLECCIN GENERA DATOS GENERALMENTE DE TIPO SECUNDARIO

LAS ENCUESTAS: ES UN MTODO DE RECOLECCIN DE DATOS SISTEMTICO PERO EVENTUAL, DE CORTE TRANSVERSAL
CMO PROCESAR LOS DATOS

PRESENTACIN DE DATOS EN TABLAS


PARA ORGANIZAR LOS DATOS Y PRESENTARLOS EN FORMA DE TABLA LO PRIMERO QUE
TENEMOS QUE HACER ES AGRUPAR A LOS INDIVIDUOS O UNIDADES DEL ESTUDIO

TABLA DE DISTRIBUCIN DE FRECUENCIAS


LA TABLA DE DISTRIBUCIN DE FRECUENCIAS PERMITE ORDENAR EL NMERO DE INDIVIDUOS
QUE PERTENECEN A CADA CATEGORA DE LA VARIABLE
GRAFICOS
Presentaciones estadsticas y representaciones
grficas
Son los mtodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la mxima informacin con
una rpida visualizacin , manejo de esttica y sencillez operativa .
Pueden ser de dos tipos:
Tablas:
Forma sencilla y clara de agrupar la informacin
Pueden ser sencillas o complejas segn la cantidad de datos
Es importante el manejo lgico de la disposicin
Grficos:
Permiten visualizar la informacin y sus relaciones
Es una forma ilustrativa y clara de los datos
Es una forma creativa y artstica de presentacin 24
Fila: unidad de observacin (paciente, pieza dentaria, sitio periodontal)

Columna: VARIABLE
VARIABLES : REPRESENTACIN TABULAR
VENTAS MENSUALES POR ZONA
Volumen Volmen Volmen
Fecha de Volmen %
Ventas Ventas Ventas Total
Venta Ventas Sur Mensual
Norte Centro Forneo

Enero $8,691.89 $19,156.00 $57,793.83 $28,688.78 $114,330.50 18.7%

Febrero $1,617.88 $1,076.03 $19,437.13 $19,321.98 $41,453.02 6.8%

Marzo $1,223.00 $6,677.00 $33,278.32 $20,249.31 $61,427.63 10.1%

Abril $9,645.62 $0.00 $21,343.71 $14,846.76 $45,836.09 7.5%

Mayo $1,051.57 $4,354.00 $19,174.22 $16,886.01 $41,465.80 6.8%

Junio $4,387.45 $0.00 $20,529.59 $22,709.82 $47,626.86 7.8%

Julio $3,362.64 $8,899.00 $26,405.06 $21,065.89 $59,732.59 9.8%

Agosto $0.00 $0.00 $0.00 $0.00 $0.00 0.0%

Septiembre $1,681.32 $1,036.16 $26,598.83 $30,541.29 $59,857.60 9.8%

Octubre $7,132.00 $0.00 $25,738.73 $21,813.00 $54,683.73 9.0%

Noviembre $1,051.57 $2,345.00 $18,477.38 $22,846.24 $44,720.19 7.3%

Diciembre $2,334.00 $6,487.00 $14,802.09 $15,639.72 $39,262.81 6.4%

Total $42,178.94 $50,030.19 $283,578.89 $234,608.80 $610,396.82

26
% por Zona 6.9% 8.2% 46.5% 38.4%
VARIABLES CUALITATIVAS:
REPRESENTACIN GRFICA
Sabores de refrescos preferidos por 50 personas

Clases Frecuencias Frecuencias


Refrescos absolutas: fi relativas: hi

Naranja 18 0,36
Limn 12 0,24
Pia 10 0,20
Manzana 10 0,20
Sumas 50 1

Sabores de refescos

20 Manzana
18 20%
16 Naranja Naranja
14 36%
Limn
Frecuencias

12
10 Pia
Pia
8 Manzana
20%
6
4
2 Limn
0 24%
Naranja Limn Pia Manzana
27
VARIABLES CUANTITATIVAS:
REPRESENTACIN GRFICA
Frecuencia por Volmen de Ventas
Ventas Mensuales por Zona

$120,000.00
$80,000
$70,000 $100,000.00

Venta Total
$60,000
$80,000.00
$50,000
$40,000 Venta $60,000.00
$30,000
$20,000 $40,000.00
$10,000 $20,000.00
$-
$0.00

99
9

9
99

to

e
ril
zo

e
o

lio
99

99

99

99

99

99

99

99

e
o

br

br
ay

br
er

er

ni
,9

r
Ab

os

ub
Ju
ar
4,
1,

2,

3,

5,

6,

7,

8,

9,

Ju

m
m
En

br

M
10

Ag
M

ct

ie

ie
ie
Fe

O
a

ov

ic
pt
a

D
Se

N
0

00
0

0
00
00

00

00

00

00

00

00

00
Mes

,0
4,
1,

2,

3,

5,

6,

7,

8,

9,

10
Volmen de Ventas Norte Centro Sur Forneo

Comparativo ventas Josefina vs. Juan

$60,000
$50,000
$40,000
Venta

$30,000
$20,000
$10,000
$0

e
zo
o

to

e
Fe o

ri l

O re
lio
o

e
ay

br
er

br
er

ni

N ubr
Se os
Ab

b
ar

Ju
Ju

m
En

br

m
m
M

Ag
M

ct

ie

ie
ie

ov

ic
pt

D
28
Mes

Josefina Romero Garca Juan Rodrguez Maldonado


MEDICIONES USADAS EN EPIDEMIOLOGIA

Medidas de Medidas de Medidas de


Frecuencia de asociacin Impacto
enfermedad (de efecto) Potencial

Incidencia Prevalencia Impacto de Impacto de


Medidas de Medidas de
Diferencia Diferencia remover la remover la
Absoluta Relativa o exposicin exposicin
de Razn sobre los en la
(Riesgo Relativo) expuestos poblacin
Incidencia Puntual
Acumulada Periodo Diferencia
Proporcin de riesgo Razn de
de Incidencia Exceso Riesgo Riesgo
Odds de Riesgo
de riesgo Razn de Atribuible Atribuible
Prevalencia Riesgos Exceso de Poblacional
Incidencia
Densidad de Atribuible Acumulada Riesgo
Incidencia Riesgo
Tasa de Razn Riesgo Atribuible
Incidencia Nmero de tasas Atribuible Poblacional
necesario a Razn de Porcentual Porcentual
tratar Tasa de Fraccin Fraccin
Incidencia Etiolgica Atribuible
Odds Ratio Porcentual Poblacional
OR prevalencia
CMO INTERPRETAR LOS DATOS

LAS MEDIDAS DE RESUMEN


MEDIDAS DE FRECUENCIA: RAZN, PROPORCIN O PORCENTAJES Y TASAS.

MEDIDAS DE TENDENCIACENTRAL: MEDIA, MEDIANA Y MODA

MEDIDAS DE DISPERSIN: RANGO, RANGO INTERCUARTLICO, DESVO ESTNDAR.

MEDIDAS DE ORDEN: CENTILES, CUARTILES


MEDIDAS DE FRECUENCIA
FRECUENCIA ABSOLUTA
INDICA LA MAGNITUD DE UN EVENTO O CARACTERSTICA, ES DECIR, LAS VECES QUE STA
SE REPITE EN NMERO DE PERSONAS, EPISODIOS O EVENTOS.
EJEMPLOS: NMERO DE PERSONAS EXPUESTOS A PLOMO, NMERO DE MUJERES Y
HOMBRES AFECTADOS POR CNCER DE PNCREAS, NMERO TOTAL DE VIVIENDAS
COMPROMETIDAS.

FRECUENCIA RELATIVA
PARA COMPARAR ADECUADAMENTE LA FRECUENCIA DE LOS EVENTOS DE SALUD ES
NECESARIO CONSTRUIR UNA MEDIDA QUE SEA INDEPENDIENTE DEL TAMAO DE LA
POBLACIN EN LA QUE SE REALIZA LA MEDICIN.
ESTAS MEDIDAS SE OBTIENEN, EN GENERAL, RELACIONANDO EL NMERO DE CASOS
(NUMERADOR) CON EL NMERO TOTAL DE INDIVIDUOS QUE COMPONEN LA POBLACIN
(DENOMINADOR).
LAS MAS USADAS SON RAZONES, INDICES , PROPORCIONES Y TASAS
MEDIDAS DE FRECUENCIA

RAZN ESTA MEDIDA DE FRECUENCIA SE EMPLEA PARA VARIABLES DE TIPO


NOMINALES. RAZN ES UNA DIVISIN QUE NO IMPLICA NINGUNA RELACIN
ESPECFICA ENTRE EL NUMERADOR Y EL DENOMINADOR

PROPORCIONES O PORCENTAJES LA PROPORCIN ES UNA MEDIDA DE


FRECUENCIA EN LA QUE SE EXPRESA QU PARTE DEL TOTAL DE OBSERVACIONES
PRESENTA DETERMINADA CARACTERSTICA. EL NUMERADOR EST INCLUIDO EN EL
DENOMINADOR

TASAS LA TASA ES UNA MEDIDA QUE EXPRESA EL NMERO DE EVENTOS


OCURRIDOS Y EN UNA POBLACIN DETERMINADA
MEDIDAS DE FRECUENCIA
PREVALENCIA

NMERO DE CASOS EXISTENTES DE UNA ENFERMEDAD.


ESTIMA LA CARGA DE LA ENFERMEDAD
USADA EN ENFERMEDADES CRNICAS O AQUELLAS DE LARGA
DURACIN
PERIODO DE PREVALENCIA - UNA PROPORCIN
# DE CASOS EXISTENTES EN UNA PERIODO DE TIEMPOS ESPECIFICO
POBLACIN EN RIESGO EN EL MISMO PERIODO
PUNTO DE PREVALENCIA - IGUAL QUE EL PERIODO, SLO QUE
ES EN UN PUNTO EN EL TIEMPO
MEDIDAS DE FRECUENCIA
INCIDENCIA

NMERO DE NUEVOS CASOS DE UNA ENFERMEDAD EN UN


PERIODO DE TIEMPO ESPECFICO
USADA EN ENFERMEDADES INFECCIOSAS O DE CORTA
DURACIN
MEDIDAS DE TENDENCIA CENTRAL

MODA (MO) VALOR QUE SE PRESENTACON MAYOR FRECUENCIAEN EL CONJUNTO DE LOS


DATOS OBTENIDOS
MEDIA ARITMTICA (X) LA MEDIA ARITMTICA ES TAMBIN CONOCIDA COMO PROMEDIO. SE
CALCULA COMO LA SUMA DE LAS OBSERVACIONES DIVIDIDA POR EL NMERO TOTAL DE
OBSERVACIONES (N).
M EDIANA (M D) LA MEDIANA ES LA OBSERVACIN QUE DEJA LA MITAD DE LOS DATOS
(ORDENADOS DE MENOR A MAYOR) A CADA LADO. SI EL NMERO TOTAL DE OBSERVACIONES
(N) ES IMPAR EXISTIR UNA NICA MEDIANA Y SER EL VALOR QUE OCUPE LA POSICIN
CENTRAL. SI EL NMERO DE OBSERVACIONES ES PAR, NO EXISTE UN NICO VALOR CENTRAL
Y LA MEDIANA CORRESPONDE A LA MEDIA DE LOS DOS VALORES CENTRALES.
EL PROBLEMA
EL PROFESOR DE ESTADSTICA LLEV A CLASE UN
BOTE DE CRISTAL LLENO DE BOLITAS, DIJO QUE HABA
ENTRE 20 Y 30, Y PREGUNT CMO PODAMOS
AVERIGUAR CUNTAS BOLITAS HABA SIN SACARLAS
DEL TARRO.
LA MUESTRA
TODAS LAS RESPUESTAS LAS RECOGIMOS EN UNA LISTA
NUMRICA, OBTENIENDO CON ELLO UNA MUESTRA
ESTADSTICA:

21,25,24,29,26,24,23,25,28,29,
26,22,25,21,22,24,24,26,23,21

ESTA LISTA CORRESPONDE A LAS 20 RESPUESTAS OBTENIDAS DE TODOS LOS COMPAEROS DE CLASE.
UNA MEDIDA DE CENTRALIZACIN
RAZONAMOS QUE EL NMERO EXACTO DE BOLITAS
DEBERA DE SER UN VALOR CENTRAL EN LA MUESTRA,
ALGUNOS TENDRAN QUE HABERSE PASADO Y OTROS
DEBERAN DE HABERSE QUEDADO CORTOS.
LA MEDIA
EL ALUMNO X PROPUSO QUE ESE VALOR CENTRAL
SE PODA OBTENER SUMANDO TODAS LAS
RESPUESTAS Y DIVIDIENDO POR EL NMERO DE
RESPUESTAS. A ESTA MEDIDA OBTENIDA DE ESA
FORMA SE LE LLAMA MEDIA.

MEDIA = 21+25+24+29+26+24+23+25+28+29+26+22+25+21+22+24+24+26+23+21

MEDIA = 24,4 20
LA MODA
RESPUESTAS FRECUENCIA

EL ALUMNO Y DIJO QUE 21 3


22 2
ERA MEJOR ELEGIR COMO 23 2

24 4
VALOR CENTRAL LA 25 3

RESPUESTA QUE HUBIESE 26 3


28 1
SIDO MS REPETIDA. A 29 2

ESTA MEDIDA SE LE LLAMA


MODA.
LA MEDIANA
UN TERCER ALUMNO LLAMADO Z PROPUSO QUE HABA QUE
ORDENAR TODAS LAS RESPUESTAS DE MENOR A MAYOR Y
TOMAR EL VALOR QUE QUEDASE EN EL MEDIO DE LA FILA
ORDENADA. A ESTA MEDIDA AS OBTENIDA SE LE LLAMA
MEDIANA.

21,21,21,22,22,23,23,24,24,24,24,25,25,25,26,26,26,28,29,29

------------------50%------------------ ------------------50%------------------
COMO LA MITAD DE LA LISTA CAA ENTRE 24 Y 24, (LA LISTA ERA PAR) EL ALUMNO Z
CONCLUY QUE EL CENTRO DE ESTOS DOS NMEROS ERA 24, CON ESTO LA MEDIANA=24.
LA RESPUESTA
DESPUS DE OBTENER LAS RESPUESTAS QUE
PROPUSIERON X, Y Y Z:
MEDIA=24
MODA=24
MEDIANA=24
LA CONCLUSIN UNNIME FUE QUE HABA 24
BOLITAS EN EL FRASCO.
LA EVALUACIN DEL PROFESOR

EL PROFESOR DIJO QUE LA RESPUESTA CORRECTA ERA


24, PERO PLANTE QUE ERA NECESARIO DISCUTIR SI
LA MEDIA, LA MODA O LA MEDIANA OBTENAN, EN
ESTE CASO, DE FORMA CONSISTENTE EL CENTRO DE
LA MUESTRA. POR OTRA PARTE INDIC QUE EL
MTODO ESTADSTICO ERA UNA BUENA
APROXIMACIN A LA SOLUCIN.
DISCUSIN
TENER EN CUENTA QUE:
LA MEDIA: SE DESCENTRA CUANDO HAY ALGN DATO
NUMRICO MUY DISTANTE DEL RESTO.
LA MODA: SE DESCENTRA SI HAY POCOS DATOS E
INCLUSO EN ESE CASO ES FCIL QUE APAREZCAN
VARIAS MODAS.
LA MEDIANA: OBTIENE EL CENTRO POSICIONAL Y NO
TIENE EN CUENTA LOS VALORES, SALVO EL CENTRAL O
LOS DOS CENTRALES.
DISTRIBUCIN SIMTRICA O ASIMTRICA
GAUSSIANA
MEDIDAS DE ORDEN

PERCENTILES SON VALORES QUE DIVIDEN AL CONJUNTO DE DATOS, DEJANDO POR DEBAJO
DE ELLOS DETERMINADOS PORCENTAJES.

CUARTILES SON TRES VALORES QUE DIVIDEN AL CONJUNTO DE DATOS OBSERVADOS EN


CUATRO PARTES DE FORMA TAL QUE EL 25% QUEDA POR DEBAJO DEL CUARTIL 1, EL 50 %
POR DEBAJO DEL CUARTIL 2 Y EL 75% POR DEBAJO DEL CUARTIL 3. LOS CUARTILES, POR LO
TANTO, SON LOS PERCENTILES 25, 50 Y 75, RESPECTIVAMENTE. LOS CUARTILES SE DENOTAN
POR Q1, Q2 Y Q3.
MEDIDAS DE DISPERSIN

EXPRESAN EL GRADO DE VARIACIN DE LOS DATOS

RANGO (R) SE CALCULA COMO LA DIFERENCIA ENTRE LA MAYOR Y LA MENOR OBSERVACION

DESVIO ESTANDAR (S O DE) MIDE LA DISPERSIN DE LOS DATOS ALREDEDOR DE LA MEDIA ARITMTICA
68% DE LAS OBSERVACIONES ESTN ENTRE LA MEDIA MENOS UN DESVO Y LA MEDIA MAS UN DESVIO
95% DE LAS OBSERVACIONES ESTN ENTRE LA MEDIA MENOS DOS DESVOS Y LA MEDIA MS DOS DESVOS.
99.7 % DE LAS OBSERVACIONES ESTN ENTRE LA MEDIA MENOS TRES DESVOS Y LA MEDIA MS TRES DESVOS
DESVIACIN ESTNDAR
ES UNA MEDIDA DE LA VARIABILIDAD DE UN CONJUNTO DE
DATOS. SE CALCULA SACANDO LA RAZ CUADRADA DE LA
VARIANZA. NOS INDICA CUNTO TIENDEN A ALEJARSE LOS
DATOS DEL PROMEDIO. SI LOS DATOS SON DE UNA
MUESTRA, LA DESVIACIN ESTNDAR SE REPRESENTA
COMO:
S=
8 cms.

Existe alguna variacin respecto de su altura entre estos rectngulos?

Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos tienen


la misma base).

Cul es el promedio de la altura de estos rectngulos?

8+8+8+8+8+8+8+8+8 72
= =8
9 9
10 cms

6 cms

8 cms.

El quinto rectngulo y el octavo rectngulo en un acto de rebelda cambiaron


su altura. El quinto rectngulo, ahora de color rojo, mide 10 centmetros, y el
octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 72
= =8
9 9
el mismo promedio. Pero... ha habido variacin?
Cmo ensear la varianza?
10 cms

6 cms

8 cms.

El rectngulo rojo tiene +2 centmetros sobre el promedio, y el rectngulo


azul tiene 2 centmetros bajo el promedio. Los otros rectngulos tienen cero
diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio, tenemos

0+0+0+0+2+0+02+0 =0

Este valor nos parece indicar que no ha habido variabilidad! Y sin


embargo, ante nuestros ojos, sabemos que hay variacin.
10 cms

6 cms

8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que sean
negativas, esto es de aquellos mediciones que estn bajo el promedio, es
elevar al cuadrado todas las diferencias, y luego sumar...

02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8

Y este resultado repartirlo entre todos los rectngulos, es decir lo dividimos


por el nmero de rectngulos que es 9

02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
= 0,89
9 9
10 cms

6 cms

8 cms.

Se dice entonces que la varianza fue de 0,89

Observemos que las unidades involucradas en el clculo de la varianza estn


al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados. De
manera que se define

La raz cuadrada de la varianza se llama desviacin estndar


10 cms

6 cms

8 cms.

Que la desviacin estndar haya sido de 0,943 significa que en promedio la


altura de los rectngulos variaron (ya sea aumentando, ya sea disminuyendo)
en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que los
causantes de la variacin fueron los rectngulos quinto y octavo. Esta
variacin hace repartir la culpa a todos los dems rectngulos que se
portaron bien.
La desviacin estndar mide la dispersin de los datos respecto del
promedio
10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?


En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9

Luego debemos calcular la varianza


10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

0,56 2,56 0,56 -0,44 -1,44


0,56
-3,44
0,56 0,56

7,44

Promedio

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9 9

Este es el valor de la varianza = 2,469


10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

7,44

Promedio

Si la varianza fue de 2,469, entonces la desviacin estndar es de...

Lo que significa que, en promedio, los rectngulos se desviaron ms o


menos (ms arriba o ms abajo) en 1,57 centmetros.
Para medir diferencias significativas entre grupos

Niveles de medicin Tipo de test descripcin grfico

Cuadro de
Test de independencia
contingencia
Chi2 Compara frecuencias y
Barras adyacentes
likelihood ratio determina si hay asociacin
Nominal-nominal Barras
linear by linear o no
Nominal-ordinal superpuestas
association /
Barras
dependencia/independencia
superpuestas
-no paramtricos-
al 100%
Compara rel con algn
Kendalls tau
parmetro (ej. media y
Spearsmans rho
Cuanti-nominal mediana)
-no paramtricos- Box Plot
Cuanti-ordinal de v cuanti entre subgrupos
T-test
de
(igualdad de medias)
v cuali
Para medir asociaciones de variables
Niveles de
Tipo de test descripcin grfico
medicin

Permite conocer la
Kendall
Nominal-nominal direccin y
(Kruskal Wallis)
Nominal-ordinal fuerza de la asociacin
-no paramtricos-
(directa, inversa)

Dependencia/independ
Tests de
encia
correlacin
Correlacin directa /
Pearson Corr.
inversa
Coeficientes
Rel correlacin con
Cuanti-nominal estandarizados Dispersin
funcin
Cuanti-ordinal / no estandarizados Box Plots
matemtica
No paramtricos
(permite predecir el
(dif. medianas)
comportamiento e una
Paramtricos
V a partir del de la otra)
(dif. medias)
PRACTICO

1 REALIZAR UNA TABLA CON LAS EDADES DE CADA UNO DE LOS INTEGRANTES DEL GRUPO
OBTENER LA MEDIA, MEDIANA, MODA Y RANGO DE LOS DATOS OBTENIDOS
OBTENER VARIANZA Y DESVIACIN STANDARD

You might also like