Professional Documents
Culture Documents
Hay varias razones por las cuales el estudio de una muestra es preferible al de
total del universo.
La presencia del error por muestreo parecera indicar que el estudiar una
muestra en vez de la totalidad del universo, es desfavorable y no ventajoso
como hemos indicado. Sin embargo, conviene tener presente, en primer lugar,
que el error por muestreo suele ser mucho menos importante que los errores
debidos al observador, al mtodo de observacin y a los individuos estudiados,
y en segundo lugar, que el error por muestreo puede medirse estadsticamente
y en cierto modo, puede disminuirse a voluntad, tan solo con aumentar el
tamao de la muestra.
Por lo tanto como una muestra bien tomada permite un mejor control de los
errores debido al observador, al mtodo de observacin y a los individuos
estudiados y como por otra parte, el error por muestreo puede medirse y
disminuirse, se comprende fcilmente el por qu hemos dicho que los
resultados a partir de una muestra, son mucho ms exactos que aquellos
obtenidos del estudio de todo universo.
Las condiciones que una muestra deben tener para que sea buena, es decir para que
rinda la mayor utilidad posible, son dos. La muestra debe ser adecuada en:
a. Cantidad
b. Calidad
El que una muestra sea buena en CANTIDAD, quiere decir que debe incluir un
nmero ptimo y mnimo de individuos. Hay frmulas estadsticas que
estudiaremos luego, mediante las cuales podemos calcular el nmero de
individuos que debemos incluir en cada investigacin, pero mientras tanto, las
siguientes consideraciones ayudarn a aclarar este punto.
Supongamos una lista de alumnos de los cuales 15 son hombres y una mujer.
Si de esta lista extraemos el nombre de un alumno y ste es un hombre, a
nadie se la ocurrira tomar esto como evidencia para afirmar que estos son del
sexo masculinos. Es evidente que en el mejor de los casos, se necesitar
extraer cuando menos dos nombres para afirmar que hay hombres y mujeres
en el curso, pero podra suceder que los 15 primeros nombres que extraigamos
sean de varones, en este caso extremo, sera necesario ver la totalidad de la
lista para asegurar con absoluta seguridad cual es la composicin verdadera
del curso. De la misma manera, si entre los 16 alumnos del curso hubiera 4 de
cada una de las regiones geogrficas del pas, sera imposible afirmar tal
hecho, con una muestra que tuviera menos de 4 individuos.
CALIDAD DE LA MUESTRA
El que una muestra sea buena en CALIDAD, quiere decir que debe reflejar
fielmente las caractersticas del universo del cual procede y diferir de l slo en
el nmero de unidades incluidas.
Los aspectos referentes a la calidad de la muestra, son ms importantes que
los referentes a su cantidad y no debe pensarse que la calidad de la muestra
depende de su cantidad. Si queremos estudiar las caractersticas del pueblo
Venezolano, y nos emperamos en estudiar a los habitantes de Mrida,
aunque estudiaramos a todos ellos, nuestra muestra no sera representativa
de todo el pas.
TIPOS DE MUESTRAS
a. Muestras de Conveniencia.
b. Muestras Probabilsticas.
MUESTRAS DE CONVENIENCIA
MUESTRAS PROBABILSTICAS
Elegir los individuos al azar no quiere decir elegirlos sin ton ni son, a nuestra
voluntad o a voluntad de otros, quiere decir elegirlos por un mtodo
perfectamente estudiado en tal forma que la voluntad no tenga ninguna
participacin en dicha eleccin tal como se hace en el popular juego de la
lotera o bingo, en el cual la obtencin de cualquier nmero es obra de la
suerte. Veremos enseguida, que slo para aquellos casos en los cuales el azar
se utiliza como sistema de eleccin de los individuos, ha sido imposible
determinar y valorar la variacin que es dado esperar entre diversas muestras.
DEMOSTRACION PRACTICA
Con tal fin vamos a presentar los resultados de una de estas demostraciones,
obtenidas en el ltimo curso de mdicos higienistas. La demostracin consisti
en colocar 500 metras blancas y 500 metras negras en una caja y despus de
mezclarlas cuidadosamente se pidi a los alumnos del curso que sacarn, sin
ver, muestras de 10 metras.
Cada vez que se extraa una muestra se anotaba el nmero de metras blancas
obtenidas y luego de retornar las 10 metras a la caja se mezclaban
convenientemente antes de obtener otra muestra en esta forma se obtuvieron
150 muestras en total, las cuales se presentan en el cuadro No. 1, clasificadas
de acuerdo al nmero de metras blancas.
Cuadro No. 1
Distribucin de 150 Muestras de 10 metras cada una de acuerdo al
nmero de metras blancas obtenidas
(Metras blancas en el universo 50%)
TIPOS DE MUESTREO
El objeto de encontrar los pasos para una encuesta por muestreo es recalcar
que el muestreo es un negocio prctico y exige muchas y diversas habilidades.
En algunos pasos, como por ejemplo en la definicin de la poblacin, en la
determinacin de los datos a recoger y de los mtodos de medicin, y en la
organizacin del trabajo de campo, poco o nada tiene que ver la teora del
muestreo. Aunque estos asuntos no se discutirn en el resto del libro, hay que
tener presente su importancia. El muestreo requiere atencin en todas las
fases de la actividad: un trabajo mediocre en una de ellas puede arruinar toda
la encuesta
El propsito de la teora del muestreo es que ste sea ms eficiente. Su
objetivo es desarrollar mtodos de seleccin de muestras y de estimacin, que
proporcionen, al menor costo posible, estimaciones con la suficiente exactitud
para nuestros propsitos. Este principio de exactitud especfica a costo mnimo
aparece una y otra vez en la presentacin de la teora
Para las encuestas en las que slo se realizan pocas mediciones en cada
unidad, el estudio de sus distribuciones de frecuencia puede justificar la
hiptesis de que son de forma matemtica conocida, lo que permite la
aplicacin de la teora clsica
Otra diferencia es que las poblaciones en una encuesta tienen un nmero finito
de unidades. Los resultados son ligeramente ms complicados cuando el
muestreo es de una poblacin finita y no de una infinita. Por razones prcticas,
a menudo se ignoran estas diferencias en los resultados para poblaciones
finitas e infinitas.
Requisitos de una muestra.
Cualitativamente debe ser buena, vale decir representativa del Universo al que
pertenece. Una muestra representativa debe ser:
Distribucin Muestral
Intervalos de Confianza
68 z = 1.65
95 z = 1.96
99 z = 2.58
Tamao de la muestra
Como tomarla?
Mtodos de Muestreo
1. Probabilsticos.
1.1 Condiciones:
2. No Probabilsticos.
Mtodos de Muestreo
1. Probabilsticos.
1.1 Condiciones:
a. Probabilidad (p) de eleccin de cada individuo de la muestra
va a ser diferente a cero y perfectamente conocida.
2. No Probabilsticos.
Eex=DE/Vn
Pasos.
1. Calcular el X de la serie.
2. Calcular la DE.
3.Dividir DE/Vn
EE%=Vp.q/n
Interpretacin del EE
INTRODUCCION
SIGNIFICANCIA ESTADISTICA:
Ejemplo:
22
z 95% :1,96
E 5%: 0,05
Conviene por otra parte considerar que la significacin estadstica entre dos
variables depende de dos componentes fundamentales. El primero es la
magnitud de la diferencia a testar. Cuanto ms grande sea la diferencia entre
las dos variables, ms fcil es demostrar que la diferencia es significativa. Por
el contrario si la diferencia entre ambas variables es pequea, las posibilidades
de detectar diferencias entre las mismas se dificulta. El segundo componente
fundamental a tener en cuanta al testar diferencias entre dos variables es el
tamao muestral. Cuanto ms grande sea dicho tamao muestral ms fcil es
detectar diferencias entre las mismas. Pequeas diferencias se pueden
detectar con grandes tamaos muestrales y grandes diferencias entre variables
necesitan muchos menos pacientes o individuos a ser estudiados. Cualquier
diferencia puede ser estadsticamente significativa si se dispone del suficiente
nmero de pacientes.
Ejemplo:
22
z: 1,96
Mtodo
2. Aplicar formula:
H = 12 x sumatoria Ti2 3 ( N + 1 )
N ( N-1) ni
12 y 3 son constantes
ni= tamao que hay en cada grupo
VARIABLES:
Son elementos que pueden asumir diferentes valores, que pueden ser
medidos.
Tipos de variables:
INTRODUCCION
En la prctica e investigacin clnica, el termino de "normal" es de uso rutinario.
As, el medico y el investigador clnico pueden afrontar las siguientes
preguntas: Un hallazgo clnico determinado indica enfermedad?, o la cifra
obtenida de un examen de laboratorio, en un individuo, es normal o anormal?
por ello, conviene revisar los conceptos que suelen fundamentar la
demarcacin entre lo llamado normal de lo anormal, as como las limitantes yf
problemas prcticos inherentes a los mtodos utilizados en este proceso.
Caracteres fisiolgicos
Caracteres sociolgicos
Caracteres fsicos
esto quiere decir que las propiedades de la curva normal pueden aplicarse a
cualquier caracterstica que tenga una distribucin normal, y asi por ejemplo, si
la edad de un grupo de individuos es 30 aos y la DE = 3 aos, entonces:
MEDIDAS DE DISPERSIN
INTRODUCCION:
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersin nos dicen hasta que punto
estas medidas de tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la separacin, la dispersin,
la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirn comparar varias
muestras.
LA DISPERSIN
RANGO
DESVIACION ESTANDAR
VARIANZA
COEFICIENTE DE VARIACION
DECILES
CUARTILES
PERCENTILES.
EL RANGO O AMPLITUD( R ):
R = Xmx.-Xmn = Xn-X1
Ejemplo:
Ejemplo:
das de hospitalizacion en 7 pacientes con bronquitis
( calculo de la desviacin estndar)
numero del das de valores xi
paciente hospitalizacin al cuadrado
primero 1 1
segundo 2 4
tercero 3 9
cuarto 7 49
quinto 11 121
sexto 12 144
sptimo 13 169
total 49 497
Los pasos a seguir son los siguientes:
1. Sumar la observaciones = 49
2. Elevar al cuadrado cada observacin y sumar esta columna =497
3. Elevar al cuadrado las suma de las observaciones obtenidas en el
primer paso y dividir por el numero de observaciones= ( 49) 2 /7 = 343
4. restar este ultimo valor a la suma de cuadrados obtenida en el paso 2
( 497-343) = 154
5. Dividir por el numero de observaciones menos 1, ( n-1) y extraer la raz
cuadrada.
6. S= 5,07 ( este valor es la desviacin Estndar)
Pto. producto
Peso en N de medio de de la producto
kilos Personas la columnas x2 de la
Kilos fi clasede 2 x 3Prs . columnas
la case 2 x3 3x4
20-24 4 22 88 484 1936
25-29 8 27 216 729 5832
30-34 9 32 288 1024 9216
35-39 10 37 370 1369 13690
40-44 7 42 294 1764 12348
45-49 6 47 282 2209 13254
50-54 6 52 312 2704 16224
total 50 1850 72500
pasos:
LA VARIANZA (S2 2 ):
Ejemplo:
Xi ( Xi - ) ( Xi - )2
(Xi-)2f1
2 = ----------------
fi
Xi2fi - [(Xifi)2/N]
2 = ----------------------------
N donde N=fi
Ejemplo:
= 21,649.344 / 30 = 721.645
Propiedades de la varianza :
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersin nos dicen hasta que punto
estas medidas de tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la separacin, la dispersin,
la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirn comparar varias
muestras.
CV= s/x2
Ejemplo:
Xi ( Xi - ) ( Xi - )
2
95 95 100 = -5 (-5)2 = 25
Total XXX 50
4.08
100
Vendedor B
Xi ( Xi - ) ( X i - )2
8.16
100
Respuesta: Dado que el vendedor A tiene menor coeficiente
de variacin, A l le corresponde recibir el premio de
incentivo.
1. VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada
uno de los valores respecto a su punto central (Media ). Este promedio es
calculado, elevando cada una de las diferencias al cuadrado (Con el fin de
eliminar los signos negativos), y calculando su promedio o media; es decir,
sumado todos los cuadrados de las diferencias de cada valor respecto a la
media y dividiendo este resultado por el nmero de observaciones que se
tengan. Si la varianza es calculada a una poblacin (Total de componentes de
un conjunto), la ecuacin sera:
Ecuacin 5-6
Ecuacin 5-7
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( )
representa la media de la muestra y (n) es el nmero de observaciones
tamao de la muestra. Si nos fijamos en la ecuacin, notaremos que se le resta
uno al tamao de la muestra; esto se hace con el objetivo de aplicar una
pequea medida de correccin a la varianza, intentando hacerla ms
representativa para la poblacin. Es necesario resaltar que la varianza nos da
como resultado el promedio de la desviacin, pero este valor se encuentra
elevado al cuadrado.
Ecuacin 5-8
La varianza sera:
Desviacin estndar
La desviacin estndar () mide cunto se separan los datos.
Varianza
la varianza (que es el cuadrado de la desviacin estndar: 2) se define as:
Ejemplo
T y tus amigos habis medido las alturas de vuestros perros (en milmetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
as que la altura media es 394 mm. Vamos a dibujar esto en el grfico:
Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... pero que
no se enteren!
Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza)
Y tambin hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es
mucho ms grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, as que lo deshacemos
(con la raz cuadrada) y as la desviacin estndar es mucho ms til.
Volver arriba
Es fcil de calcular: slo suma los nmeros, despus divide por cuntos nmeros hay.
(En otras palabras es la suma dividida por la cuenta).
Ejemplo 1:
Cul es la media de estos nmeros?
3, 10, 5
La media es 6
Ejemplo 2:
Mira estos nmeros:
3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23,
29
Nmeros negativos
Qu hacemos con los nmeros negativos? Sumar un nmero negativo es lo mismo que
restarlo (quitndole el signo menos). Por ejemplo 3 + (-2) = 3-2 = 1. Sabiendo esto,
vamos a hacer un ejemplo:
Ejemplo 3:
Calcula la media de estos nmeros:
3, -7, 5, 13, -2
Hay 5 nmeros.
Para calcular la moda tienes que ordenar los nmeros que te dan.
3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29
Ordenados quedan:
3, 5, 7, 12, 13, 14, 20, 23, 23, 23, 23, 29, 39, 40, 56
As es ms fcil ver qu nmeros aparecen ms veces.
Para calcular la mediana, ordena los nmeros que te han dado segn su valor y
encuentra el que queda en el medio.
3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23,
29
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40,
56
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40,
56
En ese caso tenemos que encontrar el par central de nmeros, y despus calcular su
valor medio. Esto se hace simplemente sumndolos y dividiendo entre dos.
3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23, 29
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
Ahora hay catorce nmeros as que no tenemos slo uno en el medio, sino un par:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
21 + 23 = 44
44 2 = 22
Puedes usar la tabla de abajo para saber el rea bajo la curva desde la lnea central hasta
cualquier lnea vertical "a valor Z" hasta 3, en incrementos de 0.1
En lugar de una tabla LARGA, hemos puesto los incrementos de 0.1 hacia abajo, y los
de 0.01 de lado.
Por ejemplo, para saber el rea debajo de la curva entre 0 y 0.45, ve a la fila de 0.4, y
sigue de lado hasta 0.45, all pone 0.1736
Como la curva es simtrica, la tabla vale para ir en las dos direcciones, as que 0.45
negativo tambin tiene un rea de 0.1736
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990