Los diagramas de Caja-Bigotes (boxplots
o box and whiskers) son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y
simetría.
Para su realización se representan los tres
cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
CONSTRUCCIÓN:
Una gráfica de este tipo consiste en
una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
UTILIDADES:
·
Proporcionan una visión general de la
simetría de la distribución de los datos; si la mediana no está en el centro
del rectángulo, la distribución no es simétrica.
·
Pertenece a las herramientas de la
estadística descriptiva. Permite ver como es la dispersión de los puntos con la
mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
·
Ponen en una sola dimensión los datos de
un histograma, facilitando así el análisis de la información al detectar que el
50% de la población está en los límites de la caja.
¿Cómo crear un gráfico de cajas y bigotes?
Paso 1.
Seleccione los datos, ya
sea una sola serie de datos o varias series de datos. (Los datos que se muestran en la siguiente
ilustración son una parte de los datos usados para crear el gráfico de ejemplo
que se muestra más arriba).
Paso 2.
En Excel,
haga clic en Insertar > Insertar gráfico de
estadísticas > Cajas y bigotes, tal y como se muestra
en la siguiente ilustración.
Importante: En Word, Outlook y
PowerPoint, este paso funciona de forma un poco distinta:
·
En la pestaña Insertar,
en el grupo Ilustraciones, haga clic en Gráfico.
·
En el cuadro de
diálogo Insertar gráfico, en la pestaña Todos los gráficos,
haga clic en Cajas y bigotes.
Sugerencias:
·
Use las pestañas Diseño y Formato para
personalizar el aspecto del gráfico.
·
Si no ve estas pestañas, haga clic en cualquier
lugar del gráfico de cajas y bigotes para agregar las Herramientas de
gráfico a la cinta de opciones.
Cambiar
opciones del gráfico de cajas y bigotes
1. Haga clic con el botón derecho
en uno de los cuadros del gráfico para seleccionar ese cuadro y, en el menú
contextual, haga clic en Formato de serie de datos.
2. En el panel Formato de
serie de datos, con la opción Opciones de serie seleccionada,
realice los cambios que desee.
(La información del gráfico que sigue a la ilustración puede ayudarle a decidirse).
Opciones de serie
|
Descripción
|
Ancho del rango
|
Controla el rango entre las distintas categorías.
|
Mostrar puntos interiores
|
Muestra los puntos de datos que se encuentran entre la línea inferior
y superior del bigote.
|
Mostrar puntos del contorno
|
Muestra los puntos del contorno que se encuentran por debajo de la
línea inferior o por encima de le línea superior del bigote.
|
Mostrar marcadores medios
|
Muestra el marcador medio de la serie seleccionada.
|
Mostrar línea media
|
Muestra la línea que conecta las medias de las cajas de la serie
seleccionada.
|
Cálculo del cuartil
|
Elija un método para calcular la media:
Ambos inclusive mediana La mediana se incluye en el cálculo si N (el número
de valores de los datos) es impar.
Mediana Exclusivo La mediana es excluido del cálculo si N (el número
de valores de los datos) es impar.
|
EJEMPLO 1:
Utilizamos la ya usada distribución de frecuencias (en tallos
y hojas), que representan la edad de un colectivo de 20 personas.
36 25
37 24 39
20 36 45
31 31
39 24
29 23 41
40 33 24
34 40
ORDENAR LOS
DATOS
Para calcular los parámetros estadístico, lo primero es
ordenar la distribución
20 23
24 24 24
25 29 31
31 33 34
36 36 37
39 39 40
40 41 45
CALCULO DE
CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los
valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil
es la media aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la
distribución, es el valor de la variable que ocupa el lugar central en un
conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética
de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75%
de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA
CAJA Y LOS BIGOTES
El bigote de la izquierda representa al colectivo
de edades ( Xmín, Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
INFORMACIÓN
DEL DIAGRAMA
Podemos obtener abundante información de una distribución a
partir de estas representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha;
ello quiere decir que las edades comprendidas entre el 25% y el 50% de la
población está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de
la derecha; por ello el 25% de los más jóvenes están más concentrados que el
25% de los mayores.
El rango intercuartílico = Q3 - Q1 =
14,5; es decir, el 50% de la población está comprendido en 14,5 años.
EJEMPLO 2:
En un bosque
plantaron veinte (N=20) árboles y, al cabo de unos años, se mide la altura para
ver su evolución. Un muy buen método para ver cómo han crecido y comprobar si
existen valores extremos es el diagrama de caja. Mediante esta
representación gráfica podemos ver si hay árboles que han crecido más o menos
de lo habitual.
Se ordenan
los datos
Se calculan
los tres cuartiles.
A partir del
conjunto ordenado calculamos los cuartiles:
Se calculan
los límites admisibles inferior y superior (LI y LS) para
determinar los valores extremos.
A partir del
rango calculamos los límites:
Los valores
extremos serán todos los árboles que midan menos de 0,96m o más de 9,59m.
Tenemos dos árboles, uno de 0,94m y otro de 10,14m que serán valores extremos.
Estos valores los representamos con puntos en el diagrama de caja.
El mínimo es
el menor elemento del conjunto que sea mayor o igual al límite inferior.
El máximo es el mayor elemento que sea menor o igual al límite
superior. En este caso, el mínimo es 2,98 y el máximo 7,13.
Se dibujan
los brazos del diagrama de caja. El brazo inferior irá desde el
primer cuartil hasta el mínimo (desde el 4,20 a 2,98). El brazo superior
abarcará desde el tercer cuartil hasta el máximo (desde el 6,42 hasta el 7,13).
Los
dos puntos extremos se representan mediante un punto o círculo.
El diagrama
de caja del conjunto de la altura de estos veinte árboles es:
Esta representación proporciona
una visión rápida de la distribución, apreciándose una asimetría al
no estar Q2 en el centro, en este caso porque hay árboles más altos que
la mediana cuya altura está más separada
de la mediana que los que tienen una altura
inferior a ella, que estan más agrupados. También se puede apreciar la
existencia de valores extremos.
INTEGRANTES:
. GARCIA HERRERA Sergio Luis
. MEJIA ARRASCO Camila Cristina
. MONTOYA WOOD Alicia María
. MUÑOZ VELARDE Cindy Milagros
. SANTOS MERCADO Maria Fernanda
. SOTO PRADO Ena Liz Maria