Como ler e interpretar um gráfico de caixa


O Box-Plot, também conhecido como o gráfico de caixa e whisker, é um método gráfico de exibir cinco estatística descritiva: a mediana, quartis superior e inferior, e os valores mínimo e máximo de dados. Criado pela primeira vez por John Tukey em uma publicação de 1977, Box Plots têm evoluído para um padrão familiar e útil na interpretação dos dados. Interpretação de um gráfico de caixa é relativamente simples.

A própria caixa representa a média 50 por cento dos dados. O limite superior (também conhecido como a dobradiça) das caixas localiza o percentil 75 do conjunto de dados, enquanto o limite inferior indica o percentil 25. Muito simplesmente, o percentil 25 representa o valor em que 25 por cento dos dados é menor, e de igual modo, o percentil 75 representa o valor do que 75 por cento dos dados cai abaixo. A área entre esses dois limites é conhecida como a gama inter-quartil e isto dá uma indicação útil da propagação da média 50 por cento dos dados. Esta é uma gama mais robusto para a interpretação, porque a média 50 por cento não é afetada por valores discrepantes ou valores extremos, e dá uma visualização menos parcial da propagação de dados.

Há também uma linha na caixa que indica o (valor mais ou central) mediana dos dados. Não deve ser confundida com a média, a mediana é o valor que é o meio de conjunto de dados quando os valores são classificados por ordem, o que resulta no mesmo número de valores acima como abaixo. Esta é uma medida da tendência central, ou, em termos genéricos, onde o centro de dados é. Saber disso é importante para estimar a distribuição dos dados que você tem.

Os bigodes da caixa-enredo são as linhas verticais da trama que se estendem do caixa, e indicar os valores mínimo e máximo do conjunto de dados. Se houver outliers nos dados, os bigodes estender até o máximo de 1,5 vezes o limite inter-quartil. Agora que as peças do Box Plot foram identificados, é útil para compreender que a caixa, o bigode, mesmo a mediana pode revelar muita informação sobre um conjunto de dados, em virtude de sua posição, comprimento ou tamanho.

O ponto forte do Box Plot é sua capacidade de comparar duas populações sem saber nada sobre as distribuições estatísticos subjacentes dessas populações. A distribuição que define uma população também determina o tipo de análises estatísticas que podem ser bem aplicados, de modo que o Box Plot permite que você realmente comparar maçãs e laranjas graficamente que não pode ser directamente comparáveis