Wofür braucht man künstliche Intelligenz?
Was ist KI?
Künstliche Intelligenz ist der Oberbegriff für Technologien, die Maschinen in die Lage versetzen, Aufgaben eigenständig zu lösen – oft inspiriert vom menschlichen Denken und Lernen. Maschinelles Lernen ist ein Teilbereich der KI, bei dem Algorithmen nicht starr programmiert werden, sondern aus Beispieldaten Muster und Zusammenhänge lernen. Statt jede Regel manuell festzulegen, „lernt“ das System selbst, wie es Eingaben in Ausgaben übersetzt. Deep Learning ist eine spezialisierte Form des maschinellen Lernens, die auf künstlichen neuronalen Netzen mit vielen Verarbeitungsschichten basiert („deep“ = tief). Diese Architektur ermöglicht es, sehr komplexe Muster zu erkennen und auch bei variierenden Bedingungen präzise Ergebnisse zu liefern.
Welche Vorteile hat die Nutzung von KI in der Qualitätskontrolle?
| Problemfelder der manuellen Kontrolle | Lösung durch Vorteile der KI-gestützten Bildverarbeitung |
|---|---|
| Inkonsistente Beurteilung der Qualität | Konsistente und wiederholgenaue Beurteilung auf Basis großer Datensätze |
| Limitierte Aufmerksamkeitsspanne | 24/7 im Einsatz ohne Ermüdung |
| Aufwendige Dokumentation der Entscheidungen | Automatische Bildspeicherung mit Heatmap-Darstellung und Score-Wert zur Nachvollzieh- und Rückverfolgbarkeit |
| Höhere Personalkosten, Personalknappheit und hoher Schulungsaufwand | Unabhängig von Personalverfügbarkeit skalierbar, niedrige Einstiegshürde dank geringerem Schulungsaufwand |
|
Problemfelder der manuellen Kontrolle
|
|||
|---|---|---|---|
|
Inkonsistente Beurteilung der Qualität
|
Limitierte Aufmerksamkeitsspanne
|
Aufwendige Dokumentation der Entscheidungen
|
Höhere Personalkosten, Personalknappheit und hoher Schulungsaufwand
|
|
Lösung durch Vorteile der KI-gestützten Bildverarbeitung
|
|||
|
Konsistente und wiederholgenaue Beurteilung auf Basis großer Datensätze
|
24/7 im Einsatz ohne Ermüdung
|
Automatische Bildspeicherung mit Heatmap-Darstellung und Score-Wert zur Nachvollzieh- und Rückverfolgbarkeit
|
Unabhängig von Personalverfügbarkeit skalierbar, niedrige Einstiegshürde dank geringerem Schulungsaufwand
|
Wann kommen regelbasierte, wann KI-Bildverarbeitungssysteme zum Einsatz?
Typische Anwendungsfelder
Regelbasierte Bildverarbeitung h4>
| Vermessung, Messaufgaben |
| Codereading |
| Präzise Ausrichtung, Positionierung (auch Robot Vision, Robot Guidance) |
Kombinationen und Überschneidungen h4>
| Inspektion, Defekterkennung |
| Identifikation (Codereading, OCR / Zeichenerkennung) |
| Lokalisierung von Objekten und Features (auch Robot Vision, Robot Guidance) |
KI-basierte Bildverarbeitung h4>
| Erkennung stark variierender Objekte oder Fehler |
| Herausforderndes OCR (z. B. schlechte Druckqualität, variierende Hintergründe) |
| Lokalisierung von Objekten mit hoher Varianz |
| Klassifzierung (z. B. von Materialien oder Texturen) |
Welche KI-Technologien sind in der Bildverarbeitung im Einsatz?
Klassifizierung
Multi-Class: eine Klasse pro Bild, z. B. „Schraube“ h4>
Multi-Label: mehrere Klassen pro Bild möglich, z. B. „Schraube“, „Nagel“ h4>
Objekterkennung
Die Objekterkennung lokalisiert und klassifiziert mehrere Objekte im Bild mithilfe von Begrenzungsrahmen, sogenannten Bounding Boxes. Für jedes gefundene Objekt gibt sie an, zu welcher Klasse es gehört und wo genau es sich im Bild befindet. Es gilt, „achsparallele“ (wie im Bild zu sehen) und „orientierte“ Objekterkennung zu unterscheiden. Bei der orientierten Objekterkennung sind die Bounding Boxes mit dem Objekt ausgerichtet und beschreiben jeweils die kleinstmögliche Bounding Box.
Segmentierung
Weist jedem einzelnen Pixel im Bild eine Klasse für die exakte Abgrenzung von Objekten (z. B. Nagel, Schraube, Hintergrund) oder Defekten (z. B. Lackfehler) zu.
Hinweis: Neben gängigen KI-Modellen gibt es zunehmend auf einen spezifischen Anwendungsfall trainierte KI-Modelle, wie z. B. Deep OCR. Die optische Zeichenerkennung mittels Deep OCR nutzt neuronale Netze, die auf großen Mengen von Textbildern trainiert wurden, um Buchstaben und Zahlen zu extrahieren. Im Gegensatz zu klassischem OCR ermöglicht es die präzise Erkennung dynamischer Texte mit variabler Schriftgröße und unterschiedlichen Hintergründen, selbst bei spezifisch gestalteten oder beschädigten Aufdrucken und Labels.
Was ist ein KI-Modell?
Der Aufbau eines KI-Modells erfolgt in Layern: Der „Input Layer“ erhält die Rohdaten (z. B. Bilder). In „Hidden Layers“ werden automatisch Merkmale erkannt und der „Output Layer“ trifft darauf basierend eine Entscheidung.
Beim Training vergleicht das KI-Modell seine Vorhersagen mit der Grundwahrheit und passt die Gewichte schrittweise an. Dieser Lernprozess wiederholt sich über viele Beispiele hinweg, bis das KI-Modell Muster zuverlässig erkennt.
Nicht jedes KI-Modell ist ein neuronales Netz. Der Begriff „KI-Modell“ ist ein Überbegriff für viele Arten von Algorithmen, darunter Entscheidungsbäume, statistische Modelle und neuronale Netze. Letztere sind eine Form von KI-Modellen, die sich besonders für komplexe Aufgaben wie beispielsweise Bilderkennung oder Sprachverarbeitung eignen. Die Begriffe „neuronales Netz“ und „KI-Modell“ werden jedoch häufig synonym verwendet.
ONNX – das universelle Austauschformat
Der wenglor AI Loop – wie KI in der industriellen Bildverarbeitung funktioniert
Worauf kommt es bei der Erstellung geeigneter Datensätze an?
Eine höhere Auflösung zeigt mehr Details, erfordert jedoch längere Trainingszeiten und einen höheren Ressourcenbedarf. Die Datensatzbilder werden für das Training oft verkleinert, z. B. auf 320 × 320 Pixel (KI-Eingangsbild).
Wichtig: Das entscheidende Merkmal muss auch in dieser reduzierten Auflösung noch klar erkennbar sein. Was für das menschliche Auge sichtbar ist, kann in der Regel auch vom KI-Modell erfasst werden.
Wichtig: Die Augmentation muss realistisch und anwendungsnah bleiben, denn der Einsatz hat großen Einfluss auf die ausgewogene Genauigkeit des KI-Modells. Eine Drehung könnte z. B. ein Fehlerfall sein und ist daher nicht für jede Anwendung geeignet.
Wie kann der Aufwand des Label-Prozesses minimiert werden?
Tipp: Grenzmuster sollten gezielt mithilfe von Tags als solche markiert werden. Somit kann diese Information bei der späteren Validierung des Netzes mit einbezogen werden.
Worauf ist beim Training eines KI-Modells zu achten?
Tipp: Mehrmaliges Training des KI-Modells mit dem identischen Datensatz kann zu unterschiedlichen Performance-Werten führen. Differenzen von über 5 % deuten auf einen inkonsistenten Datensatz hin.
Je höher die Auflösung, desto
- höher ist die Auswertezeit,
- höher sind die Anforderungen an den Arbeitsspeicher zur Interferenz (Ausführung),
- länger dauert das Training,
- mehr Trainingsdaten werden benötigt, um dieselbe ausgewogene Genauigkeit zu erzielen.
Tipps und Tricks zur Nachvollziehbarkeit des KI-Modells
- Trainingsdaten werden verwendet, um das KI-Modell zu trainieren, und machen typischerweise 70 bis 80 % der Daten aus.
- Validierungsdaten werden während des Trainings verwendet, um Gewichte abzustimmen und zu prüfen, ob das KI-Modell übertrainiert (Overfitting). Sie machen typischerweise 10 bis 20 % der Daten aus.
- Testdaten werden nur verwendet, um die finale Qualität des KI-Modells zu bewerten, und machen 10 bis 20 % der Daten aus.
| Merkmal | Hold-out Validierung | K-Fold-Cross Validierung |
|---|---|---|
| Beschreibung | Datensatz wird einmalig, z. B. 80 % Training / 20 % Test, aufgeteilt | Datensatz wird in k Teile geteilt, KI-Modell wird k-mal mit je anderen Testdaten evaluiert |
| Vorteile |
|
|
| Nachteile |
|
|
Wie gelingt die Implementierung von KI in die Bildverarbeitungsanwendung?
- Es treten neue Klassen auf, die erkannt werden sollen.
- Die Score-Werte verringern sich, z. B. durch Chargenänderungen, Verschmutzung bzw. Abnutzung von Werkstückträgern oder verringerte Lichtleistung.
- Die Anforderungen an die balancierte Genauigkeit ändern sich.
Drei grundsätzliche Vorgehensweisen für das Training von KI-Modellen im Vergleich
| Cloud (z. B. AI Lab) | On-Premise | Edge | |
|---|---|---|---|
| Merkmale | Extern gehostete Cloud | Unternehmenscloud, Server, lokaler PC | Lokal, direkt auf dem Gerät in der Produktion |
| Komplexität der Anwendung | Simpel bis komplex | Individuell | Simpel |
| Kostenkontrolle | Pay-per-use, keine Anschaffungskosten für Trainingshardware | Investitionen in Hardware und Betriebskosten | Keine Zusatzkosten (läuft auf Smart Device) |
| Einrichtung und Zugang | Kein spezielles Setup notwendig, mit Internetverbindung über Browser zugängig | Installation und Einrichtung von geeigneter Trainingshardware notwendig | Läuft direkt auf der Hardware (z. B. Smart Camera), Browser/3rd Party-Software nötig |
| Trainingsflexibilität | Hohe Flexibilität von einfachen bis komplexen KI-Modellen und kleinen bis großen Datensätzen
|
Verantwortung liegt beim Betreiber | Trainingsflexibilität ist oftmals limitiert
|
| Validierbarkeit und Nachvollziehbarkeit | Statistisch robuste Validierung anhand großer Datenmengen, zentral hinterlegt | Statistisch robuste Validierung anhand großer Datenmengen, Ablage liegt in Nutzerverantwortung | Einfache manuelle Funktionsprüfung anhand von Einzelteilen |
| Zusammenarbeit und Datensatzverwaltung | Zentral administrierbar und teamfähig | Abhängig vom Setup | Nur Einzelplatzlösung, keine echte Kollaboration oder rollenbasierte Steuerung |
| Skalierbarkeit | Automatisch skalierbar über Cloudserver | Abhängig vom Betreiber (Speicher, Rechenleistung, Softwarelösung) | Nur skalierbar durch weitere Anschaffung von Edge Devices |
| Verfügbarkeit und Deployment | Zentral, von jedem Gerät aus nutzbar Skalierbares Deployment: Rollout von KI-Modellen über mehrere Linien, Standorte oder Regionen |
Lokal oder innerhalb des Netzwerks verfügbar | Dezentral, auf der lokalen Hardware bzw. im Netzwerk verfügbar (offline) |
| Datensicherheit, Zugangskontrolle und Backups | Abhängig vom Cloudanbieter, zentral mit Benutzerrollen und Backups | Abhängig vom Setup, liegt in der Nutzerverantwortung | Lokale Datenspeicherung ist sicher, aber ohne zentrale Benutzerverwaltung oder automatische Backups |
|
Merkmale
|
||
|
Cloud (z. B. AI Lab)
Extern gehostete Cloud
|
On-Premise
Unternehmenscloud, Server, lokaler PC
|
Edge
Lokal, direkt auf dem Gerät in der Produktion
|
|
Komplexität der Anwendung
|
||
|
Cloud (z. B. AI Lab)
Simpel bis komplex
|
On-Premise
Individuell
|
Edge
Simpel
|
|
Kostenkontrolle
|
||
|
Cloud (z. B. AI Lab)
Pay-per-use, keine Anschaffungskosten für Trainingshardware
|
On-Premise
Investitionen in Hardware und Betriebskosten
|
Edge
Keine Zusatzkosten (läuft auf Smart Device)
|
|
Einrichtung und Zugang
|
||
|
Cloud (z. B. AI Lab)
Kein spezielles Setup notwendig, mit Internetverbindung über Browser zugängig
|
On-Premise
Installation und Einrichtung von geeigneter Trainingshardware notwendig
|
Edge
Läuft direkt auf der Hardware (z. B. Smart Camera), Browser/3rd Party-Software nötig
|
|
Trainingsflexibilität
|
||
|
Cloud (z. B. AI Lab)
Hohe Flexibilität von einfachen bis komplexen KI-Modellen und kleinen bis großen Datensätzen
|
On-Premise
Verantwortung liegt beim Betreiber
|
Edge
Trainingsflexibilität ist oftmals limitiert
|
|
Validierbarkeit und Nachvollziehbarkeit
|
||
|
Cloud (z. B. AI Lab)
Statistisch robuste Validierung anhand großer Datenmengen, zentral hinterlegt
|
On-Premise
Statistisch robuste Validierung anhand großer Datenmengen, Ablage liegt in Nutzerverantwortung
|
Edge
Einfache manuelle Funktionsprüfung anhand von Einzelteilen
|
|
Zusammenarbeit und Datensatzverwaltung
|
||
|
Cloud (z. B. AI Lab)
Zentral administrierbar und teamfähig
|
On-Premise
Abhängig vom Setup
|
Edge
Nur Einzelplatzlösung, keine echte Kollaboration oder rollenbasierte Steuerung
|
|
Skalierbarkeit
|
||
|
Cloud (z. B. AI Lab)
Automatisch skalierbar über Cloudserver
|
On-Premise
Abhängig vom Betreiber (Speicher, Rechenleistung, Softwarelösung)
|
Edge
Nur skalierbar durch weitere Anschaffung von Edge Devices
|
|
Verfügbarkeit und Deployment
|
||
|
Cloud (z. B. AI Lab)
Zentral, von jedem Gerät aus nutzbar
Skalierbares Deployment: Rollout von KI-Modellen über mehrere Linien, Standorte oder Regionen |
On-Premise
Lokal oder innerhalb des Netzwerks verfügbar
|
Edge
Dezentral, auf der lokalen Hardware bzw. im Netzwerk verfügbar (offline)
|
|
Datensicherheit, Zugangskontrolle und Backups
|
||
|
Cloud (z. B. AI Lab)
Abhängig vom Cloudanbieter, zentral mit Benutzerrollen und Backups
|
On-Premise
Abhängig vom Setup, liegt in der Nutzerverantwortung
|
Edge
Lokale Datenspeicherung ist sicher, aber ohne zentrale Benutzerverwaltung oder automatische Backups
|