Différents types d’apprentissages en apprentissage automatique

in fr •  6 years ago 

Différents types d’apprentissages en apprentissage automatique

artificial-intelligence-2228610_1920.jpg

source

Dans cet article, nous allons introduire différents types d’apprentissage utilisés en apprentissage automatique. Nous verrons l’apprentissage supervisé, non supervisé, semi-supervisé et par renforcement. Chaque type d’apprentissage à leur spécificité et son utilisé en fonction du problème que nous rencontrons.

Apprentissage supervisé

L'apprentissage supervisé ou supervised learning est une approche d’apprentissage où nous connaissons les données sur lesquels nous travaillons. Par exemple, dans le cas d’un classificateur d’images, nous allons avoir un ensemble de données labellisées. Ainsi, nous connaissons l'étiquette de chaque image. À partir de ces étiquettes, nous allons pouvoir apprendre à notre modèle les différentes catégories représentées. Ainsi, à chaque prédiction de notre modèle, nous pouvons lui dire s’il a donné une bonne prédiction ou s’il s’est trompé. De ce fait, notre système apprend de ses erreurs. Il va chercher à minimiser l’erreur en fonction des données que nous allons lui donner.

Généralement, dans un apprentissage supervisé, nous avons trois grands temps. Un temps d’apprentissage, où nous allons donner à notre modèle un ensemble de données, ou il pourra s’entraîner. Puis une phase de validation, où nous allons chercher à vérifier l’apprentissage de notre système. Pour ce faire, nous allons prendre un ensemble de données que nous n’avons jamais montrer à notre modèle. Puis, nous allons chercher à vérifier si notre modèle arrive à bien différencier les différentes catégories. Enfin, nous avons une phase de production où nous allons pouvoir utiliser notre système.

Apprentissage non supervisé

Dans un apprentissage non supervisé ou unsupervised learning, nous ne connaissons pas la catégorie d’appartenance de nos données. Contrairement à l’apprentissage supervisé, nous n’avons ici pas de label sur nos données. Ainsi, l’objectif va être, pour notre modèle, de repérer des similarités et, en fonction de celle-ci, de déterminer certaines données qui appartiennent à la même catégorie.

Pour illustrer ce type d’apprentissage, nous avons un ensemble de données d’une population d’animaux. Nous avons récolté un ensemble de caractéristiques comme leur âge, leur poids, leur taille… L’objectif va être de déterminer si certains animaux peuvent appartenir à la même espèce et ainsi les regrouper ensemble.

Nous mesurons la qualité d’une méthode de classification non supervisée par la capacité à notre modèle de découvrir certains motifs cachés.

Apprentissage semi-supervisé

L’apprentissage semi-supervisé ou semi-supervised learning se situe entre le supervisé et le non-supervisé. En effet, dans ce type d’apprentissage, nous avons un ensemble de données étiquetées et non étiquetées. Ce qui est intéressant avec cette méthode est que nous laissons une certaine liberté à notre modèle. En effet, nous lui donnons des données sur lesquelles il va pouvoir extraire différentes caractéristiques et sur d’autres, il va devoir trouver des caractéristiques qui lui permettent de s’améliorer.

Ce type d’apprentissage est intéressant lorsque nous avons énormément de données. En effet, cela peut être fastidieux d'étiqueter l’intégralité de nos données. Cette méthode d’apprentissage nous permet d’éviter ce problème.

Apprentissage par renforcement

Dans le cas de l’apprentissage par renforcement, nous allons avoir un agent présent dans un environnement où il sera amené à prendre des décisions. Notre agent va se retrouver dans une série d’états où il aura à sa disposition un ensemble d’actions. L’objectif de notre agent est de prendre la meilleure décision possible. Pour définir la meilleure action, nous allons attribuer à chaque actions une récompense positive ou négative. Ainsi, l’objectif pour notre agent est d’obtenir la meilleure récompense possible.

Pour illustrer ce type d’apprentissage, nous pouvons prendre le cas d’un aspirateur autonome. L'environnement dans lequel il se situe est la pièce et son objectif est de la nettoyer. Pour ce faire, on peut attribuer pour chaque position de la pièce une récompense lui indiquant qu’il n’a pas encore nettoyé cette partie. Une fois passer sur une position, nous lui attribuons une récompense négative lui indiquant qu’il n’est pas censé repasser sur la même position. On pourrait aussi imaginer que lorsque notre robot aspirateur passe de l’état en charge à l’état à besoin d’être chargé, il faut qu’il privilégie le chemin de retour à la borne de chargement.

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

Félicitations @rerere pour votre beau travail!

Ce post a attiré l'attention de @ajanphoto et a été upvoté à 100% par @steemalsace et son trail de curation comportant actuellement 28 upvotes .
De plus votre post apparaîtra peut-être cette semaine dans notre article de sélection hebdomadaire des meilleurs post francophones.

Vous pouvez suivre @steemalsace pour en savoir plus sur le projet de soutien à la communauté fr et voir d'autres articles qualitatifs francophones ! Nous visons la clarté et la transparence.

Rejoignez le Discord SteemAlsace

Pour nous soutenir par vos votes : rejoignez notre Fanbase et notre Curation Trail sur Steemauto.com. C'est important pour soutenir nos membres, les steemians et Witness francophones ICI!

@ajanphoto

Un super vraiment très intéressant et bien écrit...

Toutefois, si je peux me permettre, il serait aussi intéressant pour tes lecteurs si tu pouvais ajouter quelques sources pour "en savoir plus" ou pour mieux comprendre le contexte dans lequel tu nous présentes ce type d'article...

Merci!

Merci, oui, c'est une très bonne idée.
J'essayerai de le faire pour mes futurs articles :)

Merci super intéressant ;-) ! D' accord avec @lamouthe :D

Merci :)