Apprentissage non supervisé

Dans le domaine informatique et de l'intelligence artificielle, l'apprentissage non supervisé est un problème d'apprentissage automatique. Il s'agit, pour un logiciel, de trouver des structures sous-jacentes à partir de données non étiquetées. Puisque les données ne sont pas étiquetées, il n'est pas possible d'affecter au résultat de l'algorithme utilisé un score d'adéquation. Cette absence d'étiquetage (ou d'annotation) est ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.

Apprentissage non-supervisé vs. supervisé

L'apprentissage non supervisé consiste à apprendre sans superviseur. Il s’agit d’extraire des classes ou groupes d’individus présentant des caractéristiques communes[1]. La qualité d'une méthode de classification est mesurée par sa capacité à découvrir certains ou tous les motifs cachés.

On distingue l'apprentissage supervisé et non supervisé. Dans le premier apprentissage, il s’agit d’apprendre à classer un nouvel individu parmi un ensemble de classes prédéfinies: on connaît les classes à priori. Tandis que l'apprentissage non-supervisé, le nombre et la définition des classes n’étant pas données à priori[2].

Exemple

Différence entre les deux types d'apprentissage.

Apprentissage supervisé

  • On dispose d'éléments déjà classés

Exemple : articles en rubrique cuisine, sport, culture...

Différence entre les deux types d'apprentissage.
  • On veut classer un nouvel élément

Exemple: lui attribuer un nom parmi cuisine, sport, culture...

Apprentissage non supervisé

  • On dispose d'éléments non classés

Exemple : une fleur

  • On veut les regrouper en classes

Exemple: si deux fleurs ont la même forme, elles sont en rapport avec une même plante correspondante.

Il existe deux principales méthodes d'apprentissage non-supervisées[3] :

Utilisations

Les techniques d'apprentissage non-supervisé peuvent être utilisées pour résoudre, entre autres, les problèmes suivants :

L'apprentissage non supervisé peut aussi être utilisé en conjonction avec une inférence bayésienne pour produire des probabilités conditionnelles pour chaque variable aléatoire étant données les autres.

Notes et références

  1. Guillaume Cleuziou, Une méthode de classification non-supervisée pour l’apprentissage de règles et la recherche d’information, (lire en ligne)
  2. « Classification »
  3. Pierre-Louis GONZALEZ, MÉTHODES DE CLASSIFICATION, Cnam,

Voir aussi

Articles connexes

Bibliographie