text.skipToContent text.skipToNavigation

Stichprobenverzerrung

Was ist eine Stichprobenverzerrung?

Eine Stichprobenverzerrung liegt vor, wenn die gesammelten Stichproben nicht repräsentativ für die gesamte Gruppe sind. Stichprobenverzerrung tritt also auf, wenn die Daten, die zum Trainieren oder Bewerten eines KI-Modells verwendet werden, aufgrund eines fehlerhaften oder nicht zufälligen Auswahlverfahrens nicht repräsentativ für die Teilevariation sind. Dies führt zu KI-Modellen, die bei den ausgewählten Daten gut abschneiden, bei realen Daten jedoch schlecht. Wenn beispielsweise ein KI-Modell zur Vorhersage von Teiledefekten nur mit Daten aus einem bestimmten Teil trainiert wird, kann es sein, dass es nicht auf andere Teile mit unterschiedlichen Defektmustern übertragen werden kann, was die Frage aufwirft: „Sind die Trainingsdaten des KI-Modells wirklich repräsentativ für die breitere Teilevariation, mit der es konfrontiert sein wird?
Produktvergleich