You are on page 1of 4

Gráficas de caja y bigotes

Juan Sánchez Reyes

Proverbio chino: “Una gráfica dice más que mil palabras”.

Una gráfica es una representación visual de las relaciones entre un conjunto de datos.
Constituye un diagrama que organiza y representa información. Tiene el propósito
principal de comunicar información visualmente. Por esta razón, se usa en los
periódicos, revistas, comercio, y otros, alrededor del mundo. Hay ocasiones en que
una información puede ser muy compleja para entender y necesita una ilustración.
Otras veces, una gráfica ayuda a impresionar a la gente porque permite presentar un
punto de vista en forma rápida y visual.

Hay muchos tipos de gráficas; algunas son fáciles de entender, mientras otras pueden
ser engañosas. Cada tipo de gráfica tiene su uso específico. La utilización de un
determinado tipo de gráfica depende de la naturaleza de los datos y el propósito para el
cual se dibuja la misma.

El diagrama de caja y bigotes es un tipo de gráfica de uso reciente. También se le


conoce como diagrama o gráfica de caja y patillas o simplemente gráfica de caja. Fue
creada por John W. Tukey, en 1977.

Algunas formas de describirla son las siguientes:


- Método fácil para presentar visualmente la mediana, los cuartiles y los valores
extremos.
- Es una combinación pictórica de medidas de dispersión.
- Es una representación visual de cómo se distribuyen los datos y cuánta
variación tienen.
- Representación que usa cinco números para resumir los datos: cuartil 1,
mediana, cuartil 3 y valor mínimo y valor máximo.

El siguiente diagrama indica las partes, los cinco números y la escala numérica que
están presentes en una gráfica de caja y bigotes.

Q1 Med. Q3
VMI VMA

bigote bigote
caja

Escala numérica
VMI Q1 Med. Q3 VMA
VMI = valor Q1 es el primer La mediana Q3 es el tercer VMA = valor
mínimo de cuartil o cuartil (Med.) es una cuartil o cuartil máximo de
los datos; el inferior. El medida de superior. Es los datos; el
más primer cuartil es tendencia central un número tal más grande.
pequeño. el número tal que que divide los que el 75% de
el 25% de los datos en dos los datos está
datos está bajo partes iguales, es bajo él. Divide
él. Divide la el centro, esto es, la mitad
mitad inferior de el 50% de los superior de los
los datos en dos datos está sobre datos en dos
partes iguales. la mediana y el partes iguales.
50%, está debajo.

Para calcular la mediana, es necesario ordenar los datos, preferiblemente de menor a


mayor. Si hay un número impar de datos, el dato del medio es la mediana. Si hay un
número par de datos, entonces, la mediana es el promedio de los dos valores del
medio.

Ejemplos:

1. 2, 4, 6, 8, 10, 12, 14. Como hay 7 datos, la mediana es el dato del medio, esto es, 8.
68
2. 2, 4, 6, 8, 10, 12. Como hay 6 datos, la mediana es  7.
2

Los cuartiles son valores que dividen un conjunto de datos en cuatro partes iguales. Se
usan a menudo Q1, Q2 y Q3 para representar los tres cuartiles, en los que Q2 es la
mediana.

Ejemplo: Las edades de 11 personas son: 5, 8, 12, 15, 19, 21, 25, 28, 30, 33, 35.

5, 8, 12, 15, 19, 21, 25, 28, 30, 33, 35

Q1 = 12 Q2 = Med. = 21 Q3 = 30

La amplitud intercuartílica o rango intercuartil (RIC) de una serie de datos es la


diferencia entre Q3 y Q1, esto es, RIC = Q3 – Q1. Representa la mitad central o el
50% central de los datos. En el ejemplo anterior, RIC = 30 – 12 = 18. Esto significa
que la mitad o el 50% de las edades de las personas no sobrepasan los 18 años de la
mediana, esto es, la mitad central de los datos varía por 18.

Un valor que es mucho más grande o mucho más pequeño que los otros, se conoce
como valor atípico (“outlier”). Un valor atípico es un dato que está a por lo menos
1.5RIC sobre Q3 o bajo Q1.
En nuestro ejemplo, todo valor que esté sobre 30 + 1.5(18) = 57 o bajo 12 – 1.5(18) = -
15, es un valor atípico. Los valores atípicos se grafican como puntos aislados.

Ejemplo: Dibuja una gráfica de caja y bigotes para los siguientes datos: 23, 27, 39, 46,
46, 51, 53, 54, 55, 60, 69, 81.

51  53 39  46 55  60
La med. =  52 , Q1 =  42.5 , Q3 =  57.5 y los valores
2 2 2
extremos son 23 y 81. RIC = 57.5 – 42.5 = 15.

Para determinar valores atípicos, se calcula: 57.5 + 1.5(15) = 80 y 42.5 – 1.5(15) = 20.
Como 81 > 80, es un valor atípico. La gráfica es la siguiente:

20 30 40 50 60 70 80
Algunas ventajas de la gráfica de caja y bigotes son:

- Es fácil de interpretar y visualizar.

- Es útil para comparar una misma variable para grupos diferentes.

- No presenta un amontonamiento de todos los datos, esto es, no muestra todos


los datos.

- Destaca solamente algunas características de los datos.

- No se hace más complicada con mayor cantidad de datos.

- Es buena para visualizar los valores extremos y el alcance de los valores


centrales.

Una desventaja de este tipo de gráfica es que no es apropiado para pocos datos.

Las gráficas de caja y bigotes se pueden dibujar usando una calculadora gráfica, como
la TI-83 Plus. A continuación se ofrecen alguna ayuda para hacer esto.

1. Copia los datos en la lista L1.

2. Ordena los datos en forma ascendente.


Oprima  [LIST]  1  L1 .

3. Calcula cuartiles y mediana. Oprime 


 1  L1 . Observa que Med. = 11,
Q1 = 9, Q3 = 14, VMI = 5 y VMA = 16.
4. Dibuja la gráfica. Oprime  [STAT PLOT]1 y haga las selecciones para obtener
la Fig. 1. Luego, oprime   y debes obtener la Fig. 2.

Fig. 1 Fig. 2
Oprime  y usa las teclas de flechas () para ver el valor mínimo, Q1, Med., Q3 y el
valor máximo.

5. Para visualizar un posible valor atípico, añade el valor 35 a los datos anteriores.
Oprima 35   L1    . Repite el paso # 4, pero selecciona el primer tipo de
gráfica de caja (Ve Fig. 3). La gráfica que se obtiene ilustra que 25 es un valor
atípico y se representa con un punto (Ve Fig. 4)

Fig. 3 Fig. 4

Referencias:

Tukey, J. W. (1977). Box-and-Whisker Plots. Explanatory Data Analysis. MA:


Addison-Wesley, pp 39-43.

http://www.geocities.com/thesciencefiles/box/plot.html

http://mathstar.nmsu.edu/investigation1/box_wisker.html

http://argyll.epsb.edmonton.ab.ca/jreed/comphelp/boxplot.html

You might also like