Introduction

Le principe de la classification hiérarchique ascendante est de rassembler des individus selon un critère de ressemblance défini au préalable qui s’exprimera sous la forme d’une matrice de distances, exprimant la distance existante entre chaque couple d’individus. Deux observations identiques auront une distance nulle. Plus les deux observations seront dissemblables, plus la distance sera importante.

L'algorithme va ensuite rassembler les individus de manière itérative afin de produire un dendrogramme ou arbre de classification. La classification est ascendante car elle part des observations individuelles ; elle est hiérarchique car elle produit des classes ou groupes de plus en plus vastes, incluant des sous- groupes en leur sein. En découpant cet arbre à une certaine hauteur choisie, on produira la partition désirée.

Fonctionnement étape par étape

Voici un petit résumé du fonctionnement de l'algorithme classification hiérarchie ascendante:
diapositive1

Jupyter

Le fichier Jupyter va te permettre de tester tes connaissances sur le fonctionnement de l'algorithme.
Il y a des parties à compléter sur les points clés de l'algorithme pour mieux comprendre son fonctionnement.
Cela te permettra en même temps de faire le code (en Python) de l'algorithme, ce qui peut être utile si tu en as besoin pour la suite.


Fiche résumé

Bravo !
Tu as fini ce tutoriel sur le Regroupement Hiérarchique.
A ce stade, tu dois avoir compris le fonctionnement de l'algorithme, ce n'est maintenant plus une boite noire pour toi !
Néanmoins, si jamais il te venait à oublier certains détails, voici une fiche résumé qui te rafraichira la mémoire !