You are on page 1of 3

Document downloaded from http://www.elsevier.es, day 30/06/2017. This copy is for personal use.

Any transmission of this document by any media or format is strictly prohibited.

Volumen 27, Nmero 8, Sptiembre 2001

notas estadsticas
Desviacin estndar y error estndar
V. Abraira
Unidad de Bioestadstica Clnica. Hospital Ramn y Cajal. Madrid.

Una pregunta que frecuentemente plantean los investi- aproximadamente los 68.000 individuos con edades ms
gadores que consultan en la Unidad de Bioestadstica Cl- cercanas a la media tendran edades comprendidas entre
nica es qu ndice debo poner en mis tablas o grficas de 29,6 y 59,4 (realmente en ese intervalo hay 67.961 indivi-
resultados: la desviacin estndar o el error estndar de la duos) y 95.000 estaran entre 15,3 y 73,7 (realmente hay
media? Esta duda en parte se sustenta en el hecho de que 95.006), de los 5.000 restantes la mitad tendran menos
en la literatura mdica se usan ambos ndices de un modo de 15,3 (en los datos hay 2.528) y la otra mitad ms de
que puede parecer casi indistinto. Por ejemplo, y con el 73,7. Estos intervalos para la poblacin B son: entre 34,5
nico fin de ilustrar esta afirmacin, en dos artculos re- y 54,5 los 68.000 individuos con edades ms cercanas a la
cientes de una misma revista (British Medical Journal), en media y entre 24,9 y 64,1 los 95.000 centrales. Hay que
uno1 aparece en la tabla de resultados la desviacin estn- resaltar que esta regla slo es cierta si la variable se ajusta
dar, mientras que en la figura de resultados del otro2 se a una distribucin normal o gaussiana; en el ejemplo la re-
presenta el error estndar de la media, con una intencin gla se cumple porque los datos ajustan perfectamente a la
que en una primera lectura puede parecer la misma: des- distribucin normal como se observa en la figura. Aunque
cribir la variabilidad de los datos. Sin embargo ambos n- con excesiva frecuencia se asume la normalidad de las va-
dices, aunque relacionados, son conceptualmente muy di- riables biolgicas, es conocido que no siempre es as3; por
ferentes. ejemplo, en la figura 2 se muestra el histograma de la edad
La desviacin estndar es una medida de la dispersin de los 507.409 individuos que componan en 1996 la po-
de los datos, cuanto mayor sea la dispersin mayor es la blacin del rea Sanitaria 4 de la Comunidad de Madrid.
desviacin estndar, si no hubiera ninguna variacin en Se observa que no ajusta bien a la distribucin normal y
los datos, es decir, si fueran todos iguales, la desviacin es- en consecuencia la regla anterior no se cumple: la media
tndar sera cero. es 39,5 y la desviacin estndar 21,8; entonces la regla
Para ilustrar cmo la desviacin estndar cuantifica la predice, por ejemplo, que debera haber aproximadamen-
dispersin alrededor de la media supnganse dos pobla- te 12.685 individuos (el 2,5% del total) con edades me-
ciones de 100.000 individuos en las que la edad se distri- nores que 39,5 - 1,96 x 21,8 = -3,2, es decir con edades
buye como se muestra en los histogramas de la figura 1. La negativas, que obviamente no se cumple.
edad media en ambas poblaciones es 44,5 y la desviacin Hay una regla menos conocida y que se puede aplicar
estndar es 14,9 en la poblacin A y 10,0 en la B. Obsr- siempre para cuantificar la dispersin de los datos, sea cual
vese que, como corresponde a una desviacin estndar sea la forma de su distribucin, basada en la desigualdad
menor, en la poblacin B las edades de los individuos es- de Chebyshev4, que establece que en el intervalo com-
tn menos dispersas alrededor de la media. Unas frmulas prendido entre la media menos k veces la desviacin es-
muy difundidas establecen que en el intervalo comprendi- tndar y la media ms k veces la desviacin estndar est
do entre la media menos la desviacin estndar y la media al menos la (1-1/k2) parte central de los datos, por ejem-
ms la desviacin estndar estn aproximadamente el 68% plo para k=2 se puede decir que entre la media menos 2
central de los datos, y que en el intervalo comprendido en- veces la desviacin estndar y la media ms 2 veces la des-
tre la media menos 1,96 (aproximadamente 2) veces la viacin estndar estn al menos los 1-1/4 = 3/4 (75%) cen-
desviacin estndar y la media ms 1,96 veces la desvia- trales de los datos.
cin estndar estn aproximadamente el 95% central de Las investigaciones rara vez se hacen sobre el conjunto
los datos. Segn esta regla, en la poblacin A del ejemplo de la poblacin; lo habitual es realizarlas en un subconjun-
to (muestra) de ella. Esta prctica est justificada porque la
teora estadstica establece que, si la muestra se selecciona
aleatoriamente, sus caractersticas (forma de la distribu-
cin, media, desviacin estndar, etc.) son parecidas a las
Correspondencia:
Dr. V. Abraira. de la poblacin y tanto ms parecidas cuanto mayor sea la
Unidad de Bioestadstica Clnica. muestra. En la figura 3 se representa el histograma de la
Hospital Ramn y Cajal. Crta.
Colmenar km 9,100. 28034 Madrid. edad de una muestra aleatoria de 100 individuos extrada
Correo electrnico: victor.abraira@hrc.es de la poblacin representada en la figura 1 A. Obsrvese

33 SEMERGEN 2002;28(11):621-3 621


Document downloaded from http://www.elsevier.es, day 30/06/2017. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.

Abraira V. Desviacin estndar y Error estndar

A 40.000 B 40.000

30.000 30.000
Figura 1. Histogramas de
20.000 20.000 frecuencias de la edad en unas
poblaciones hipotticas de
100.000 individuos. En ambas
10.000 10.000 poblaciones la media es 44,5; las
desviaciones estndar son 14,9
0 0 en A y 10,0 en B. Las lneas
continuas muestran la
0-10
10-20
20-30
30-40
40-50
50-60
60-70
70-80
80-90
90-100

0-10
10-20
20-30
30-40
40-50
50-60
60-70
70-80
80-90
90-100
distribuciones tericas
correspondientes a curvas
gaussianas con las mismas
medias y desviaciones estndar.

100.000 40

80.000 30
60.000
20
40.000

20.000 10

0 0
0-10
10-20
20-30
30-40
40-50
50-60
60-70
70-80
80-90
90-100

0-10
10-20
20-30
30-40
40-50
50-60
60-70
70-80
80-90
90-100
Figura 2. Histograma de frecuencia de la edad de la poblacin del rea Figura 3. Histograma de frecuencias de la edad en una muestra
Sanitaria 4 de la Comunidad de Madrid. Se observa que no ajusta bien a la aleatoria de 100 individuos de la poblacin representada
distribucin normal: es asimtrica, hay menos individuos cerca de la media en la figura 1. A. En la muestra la media es 46,2 y la desviacin
y, por tanto, mayor dispersin. estndar 14,7.

que es parecido al de la poblacin, aunque por ejemplo su plo, existe el error estndar de la desviacin estndar y el
ajuste a la curva normal es peor. Es importante sealarlo error estndar del riesgo relativo) y siempre cuantifica el
porque muchos mtodos estadsticos hacen asunciones so- error que se comete al estimar la verdadera medida en la po-
bre la normalidad de la poblacin. Vemos que una pobla- blacin a partir de su valor en la muestra. A partir del error
cin normal es compatible con una muestra cuyo histogra- estndar se construye el intervalo de confianza6 de la medi-
ma no ajusta visualmente a una curva normal, y ello tanto da correspondiente. El error estndar de la media estimado
ms cuanto menor sea la muestra5, por tanto la inspeccin en la muestra del ejemplo es 1,47 (se calcula dividiendo la
visual del histograma de la muestra no es un buen mtodo desviacin estndar por la raz cuadrada del tamao mues-
de evaluacin de la normalidad de la poblacin. tral4) y, calculado a partir de l, el intervalo de confianza al
En esta muestra, la media y la desviacin estndar son 95% para la media va desde 43,3 a 49,1 (el lmite inferior
46,2 y 14,7 respectivamente, tambin parecidas a las de la se calcula como la media menos 1,96 veces el error estn-
poblacin. Si se tomara otra muestra aleatoria se obtendr-
an otros valores distintos, aunque probablemente tambin
parecidos a los de la poblacin. El error estndar es el n- Puntos clave
dice que cuantifica cunto se apartan los valores en la La desviacin estndar es una medida de la dispersin de los
muestra de sus correspondientes valores en la poblacin. datos. Cuanto mayor sea la dispersin, mayor es la desviacin
Es decir, el error estndar de la media cuantifica las oscila- estndar, mientras que el error estndar de la media cuantifica las
ciones de la media muestral (media obtenida en los datos) oscilaciones de la media muestral alrededor de la media
poblacional.
alrededor de la media poblacional (verdadero valor de la Son, por tanto, ndices conceptualmente diferentes, aunque
media). No es, por tanto, un ndice de variabilidad, aun- directamente relacionados.
que depende de ella, sino una medida del error que se co- La desviacin estndar es un ndice para usar cuando se pretende
mete al tomar la media calculada en una muestra como es- describir la variabilidad de una variable continua en una muestra.
timacin de la media de la poblacin. El error estndar de la media se debe usar cuando se pretende
cuantificar el error cometido al estimar la media poblacional
Existe el error estndar, no slo de la media, sino de to- mediante la media muestral.
das las medidas que se obtienen en las muestras (por ejem-

622 SEMERGEN 2002;28(11):621-3 34


Document downloaded from http://www.elsevier.es, day 30/06/2017. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.

Abraira V. Desviacin estndar y Error estndar

dar de la media y el lmite superior como la media ms 1,96 BIBLIOGRAFA


veces el error estndar de la media y ste es uno de los m-
1. Quinn J, Cummings S, Callaham M, Sellers K. Suturing versus con-
todos estadsticos que exige normalidad de la poblacin4), servative management of lacerations of the hand: randomised con-
que quiere decir que podemos afirmar, con una probabili- trolled trial. BMJ 2002; 325:299-301.
dad de acierto de 0,95, que la media poblacional est in- 2. Waalen J, Felitti V, Beutler E. Haemoglobin and ferritin concentra-
tions in men and women: cross sectional study. BMJ 2002;325:137.
cluida en dicho intervalo. Comprese con el valor 44,5 de
3. Elveback LR, Guillier CL, Keating FRJ. Health, normality, and the
la media poblacional que, en este ejemplo y en contra de lo ghost of Gauss. JAMA 1970;211:69-75.
que ocurre en las investigaciones reales, es conocido. 4. Prez de Vargas A, Abraira Santos V. Bioestadstica. Madrid: Centro
Nota: En todo el artculo se han usado las denomina- de Estudios Ramn Areces; 1996.
5. Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ
ciones desviacin estndar y error estndar, pero en la 1995;310:298.
literatura estadstica y clnica se usan indistintamente con 6. Abraira V. Estimacin: intervalos de confianza. SEMERGEN
ellas desviacin tpica y error tpico respectivamente. 2002;28:84-5.

35 SEMERGEN 2002;28(11):621-3 623

You might also like