L'apprentissage supervisé est une approche fondamentale en intelligence artificielle (IA) où un modèle est entraîné à partir d'un ensemble de données étiquetées. Dans ce processus, le système apprend à établir des correspondances entre des entrées et des sorties prédéfinies, afin de pouvoir généraliser ces relations à de nouvelles données non vues.
Cette méthode d'apprentissage automatique se caractérise par l'utilisation d'un jeu de données d'entraînement composé d'exemples associés à leurs étiquettes ou résultats attendus. Le modèle ajuste progressivement ses paramètres internes pour minimiser l'écart entre ses prédictions et les vraies valeurs fournies.
En programmation, l'apprentissage supervisé est couramment utilisé pour des tâches telles que :
- La classification : attribuer une catégorie à une entrée (ex: reconnaissance d'images)
- La régression : prédire une valeur numérique continue (ex: prévision des prix)
Un exemple pratique d'apprentissage supervisé en Python pourrait ressembler à ceci :
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# Préparation des données
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Création et entraînement du modèle
model = LogisticRegression()
model.fit(X_train, y_train)
# Évaluation du modèle
predictions = model.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f"Précision du modèle : {accuracy}")
L'apprentissage supervisé se distingue d'autres approches en IA comme l'apprentissage non supervisé (où les données ne sont pas étiquetées) et l'apprentissage par renforcement (où le modèle apprend par essais et erreurs). Le choix entre ces méthodes dépend de la nature du problème à résoudre et des données disponibles.