-
Self service
Boxplot
Reading time:
Disponible à partir de V5.3.0
Un diagramme Boxplot est un graphique qui montre la répartition d'un ensemble de données numériques.
Ce que montre dans un diagramme Boxplot
- Médiane : la ligne à l'intérieur de la boîte — la valeur médiane des données.
- Boîte : montre l'écart interquartile (IQR), du 25e centile (Q1) au 75e centile (Q3). C'est là que se trouve la moitié centrale des données.
- Moustaches : lignes s'étendant à partir de la boîte pour indiquer l'étendue des données qui ne sont pas considérées comme des valeurs aberrantes.
- Valeurs aberrantes : points tracés individuellement au-delà des moustaches — valeurs inhabituelles ou extrêmes.
Pourquoi utiliser un diagramme en boîte ?
- Pour comparer rapidement les distributions entre les catégories.
- Pour repérer les valeurs aberrantes.
- Pour comprendre d'un seul coup d'œil la dispersion et l'asymétrie des données.
Comment ajouter un diagramme Boxplot ?
Pour créer un diagramme Boxplot, vous devez définir au moins cinq mesures à partir de votre ensemble de données. Ces cinq valeurs décrivent la distribution.
Mesures requises :
- min
min(mesure)
- 25th centile (Q1)
quantileExact(0.25)(mesure)
- Médiane (Q2)
quantileExact(0.50)(mesure)
- 75th centile (Q3)
quantileExact(0.75)(mesure)
- Max
max(mesure)
Ces valeurs suffisent pour tracer le diagramme en boîte de base.
Si vous souhaitez que votre diagramme en boîte affiche les valeurs aberrantes, vous pouvez les calculer à l'aide de la règle standard 1,5 × IQR :
- IQR (intervalle interquartile) = Q3 − Q1
Les valeurs aberrantes sont toutes les valeurs :
- inférieures à Q1 − 1,5 × IQR
- supérieures à Q3 + 1,5 × IQR
Formule :
arrayFilter(
x -> x (quantileExact(0.75)(mesure) + 1.5 * (quantileExact(0.75)(mesure) - quantileExact(0.25)(mesure))),
groupArray(mesure)
)
Cela renvoie toutes les valeurs considérées comme des valeurs aberrantes afin qu'elles puissent être représentées individuellement.
Une fois vos mesures créées :
- Ajoutez chaque mesure calculée à votre graphique.
- Ouvrez l'onglet Boxplot pour chaque mesure.
- Attribuez le rôle correct (Min, Q1, Médiane, Q3, Max, Valeurs aberrantes).
