Résumé de section
-
-
-
-
Que sont les données qualitatives?
Les données qualitatives, ou catégorielles, sont, par opposition aux données quantitatives, toutes les données autres que des nombres. On peut retrouver des chaines de caractères (pour des noms par exemple) ou des booléens (True/False, oui/non, 1/0, ...).
Les données qualitatives sont tout à fait plotables avec les outils vus précédemment. Mais il existe un outil tout-en-un qui permet de passer d’un style à l’autre facilement.
-
-
-
-
-
La fonction catplot() permet de faire différents types de graphe :

Nom du paramètre Explications Ce qui lui faut comme format Exemple data Il faut donner au paramètre data le tableau entier que vous traitez
DataFrame, Series, dict, array, or list of arrays data=tableau cmap Couleurs de la heatmap. Soit une palette de matplotlib soit une personalisée. Chaîne de caractères correspondant à une palette ou une color_palette de seaborn. cmap=”viridis” ou cmap = sns.color_palette("light:blue", as_cmap=True) annot Variable qui choisit si on affiche les valeurs des cellules Booléen annot=True, vaut False par défaut vmin Valeur minimum qui sera prise en compte pour la colormap Valeur flottante vmin=30.6 vmax Valeur maximale qui sera prise en compte pour la colormap Valeur flottante vmax=42 linecolor Variable permettant de choisir la couleur des lignes entre les cellules. Chaîne de caractère correspondant à une couleur linecolor=”blue” linewidths Variable contrôlant l’épaisseur des lignes entre les cellules Valeur flottante linewidths=0.2 ou linewidths=10 mask Variable permettant de contrôler les valeurs prises en compte dans la heatmap. Tableau de booléen au même format que data. mask=tableau_mask Il y a différents kind que nous pouvons utiliser :
- strip
- swarm
- violin
- box
- boxen
- point
- bar
- count
Code d'importation← ExécutionCellule 2← ExécutionLes graphiques "point" et "bar" affichent la moyenne ainsi que l'intervalle de confiance sur cette moyenne car elles sont calculées avec du rééchantillonnage bootstrap.
Nous pouvons utiliser les paramètres des méthodes choisies. Par exemple les boxplot() ont le paramètre fill donc on peut le spécifier dans la fonction catplot().
Cellule 3← Exécution
-
-
-