Démystifier les paradigmes d’apprentissage de l’apprentissage automatique | par Shafaqbibi | Août 2025

 Démystifier les paradigmes d’apprentissage de l’apprentissage automatique | par Shafaqbibi | Août 2025


Source de l’image: Google (utilisé à des fins éducatives uniquement)

Dans Machine Learning (ML), vous fournissez des données, qui comprennent l’entrée et la sortie. Vous n’avez pas besoin de programmer la logique de chaque condition; L’algorithme d’apprentissage automatique génère automatiquement la logique. Dans la terminologie d’apprentissage automatique, les données données à la machine en entrée sont souvent appelées caractéristiques, prédicteursou Variables indépendantes. Tandis que les données de sortie sont décrites comme le cible, étiquetteou variable dépendante. Les données peuvent être numériques (continues ou discrètes), catégorielles, ordinales, binaires, texte, images, audio, vidéo, séries chronologiques ou tabulaires (mixtes).

Recherche d’apprentissage automatique et développe des algorithmes qui apprennent les modèles des données passées et appliquent ces modèles pour faire des prédictions sur les données nouvelles ou invisibles. Pour mesurer à quel point les modèles apprennent, nous utilisons le fonction de perte ou de coût. Le La fonction de perte ou de coût est un outil mathématique pour vérifier les erreurs dans la prédiction de votre modèle. Lorsque la perte est nulle, cela signifie que les prédictions sont parfaites. Si la perte est plus élevée, cela indique que le modèle fait des erreurs plus importantes.

Dans certains cas, nous pouvons définir la fonction de perte nous-mêmes, ou parfois compter sur la par défaut. Une fois que nous mesurons la perte (erreurs), l’étape suivante consiste à le minimiser, ce qui signifie réduire la perte autant que possible. Cette étape est appelée Optimisationle processus pour trouver le meilleur Paramètres appropriés pour le modèle, de sorte qu’il produit les erreurs les plus basses possibles.

Sur la base des caractéristiques des données, les tâches d’apprentissage automatique peuvent être classées en trois grandes catégories:

  1. Apprentissage supervisé
  2. Apprentissage non surveillé
  3. Apprentissage du renforcement

Apprentissage supervisé:

Dans l’apprentissage supervisé, les modèles apprennent de Données étiquetéesce qui signifie que les données sont livrées avec des descriptions, des cibles et des sorties souhaitées. L’objectif principal de l’algorithme est d’identifier les modèles dans une nouvelle entrée en fonction de l’apprentissage et de prédire la bonne sortie.

Applications du monde réel:

L’apprentissage supervisé est couramment utilisé dans la reconnaissance de la face et de la parole, des recommandations de produits ou de films, des prévisions de ventes, de la prédiction des cours des actions et de la détection des e-mails de spam.

Appuyez sur Entrée ou cliquez pour afficher l’image en taille réelle

Source de l’image: Google (utilisé à des fins éducatives uniquement)

Apprentissage non surveillé:

Dans l’apprentissage non supervisé, les données sont venues sans étiquettes, valeurs cibles ou sorties souhaitées. L’algorithme doit découvrir des informations invisibles en trouvant en soi des modèles, des similitudes et des relations dans les données. Ce type de données d’apprentissage est connu sous le nom données non marquées.

Applications du monde réel:

L’apprentissage non supervisé est utilisé pour détecter les anomalies, telles que la fraude ou l’équipement défectueux, et les clients de groupe en segments en fonction du comportement d’achat pour une campagne de marketing, etc.

Appuyez sur Entrée ou cliquez pour afficher l’image en taille réelle

Source de l’image: Google (utilisé à des fins éducatives uniquement)

Apprentissage du renforcement:

Dans ce type d’apprentissage automatique, les agents apprennent de leur environnement au lieu d’être codés en dur avec des instructions et des données étiquetées, tout comme les humains et les animaux. Un agent apprend des essais et erreurs, ce qui signifie que l’agent effectue des actions, observe la sortie et recueille la rétroaction sous la forme de récompense, ce qui signifie une rétroaction positive, et peine, ce qui signifie une rétroaction négative. L’objectif principal de l’agent est de maximiser les récompenses au fil du temps.

Applications du monde réel:

Les applications réelles de l’apprentissage par renforcement sont la robotique pour l’automatisation industrielle, les voitures autonomes et le maître d’échecs, Alphago.

Appuyez sur Entrée ou cliquez pour afficher l’image en taille réelle

Source de l’image: Google (utilisé à des fins éducatives uniquement)



Source link

Related post