Biais de sélection
Qu’est-ce qu’un biais de sélection ?
On parle de biais de sélection lorsque les échantillons collectés ne sont pas représentatifs de l’ensemble concerné. Ainsi, un biais de sélection se produit lorsque les données utilisées pour entraîner ou évaluer un modèle d’IA ne sont pas représentatives de la variation des pièces en raison d’un processus de sélection erroné ou non aléatoire. Cela conduit à des modèles d’IA qui fonctionnent bien sur les données sélectionnées, mais mal sur les données réelles.
À titre d’exemple, si un modèle d’IA de prédiction des pièces défectueuses est entraîné uniquement avec des données relatives à une pièce spécifique, il peut sera pas transposable à d’autres pièces présentant des modèles de défaut différents, ce qui soulève la question suivante : « Les données d’entraînement du modèle d’IA sont-elles vraiment représentatives de la variation générale des pièces dans la réalité ?