¿Para qué se necesita la inteligencia artificial?
La inteligencia artificial es el término genérico para las tecnologías que permiten a las máquinas resolver tareas de forma autónoma, a menudo inspiradas en el pensamiento y el aprendizaje humanos. El aprendizaje automático es una parte de la IA en la que los algoritmos no se programan de forma rígida, sino que aprenden patrones y relaciones a partir de datos de ejemplo. En lugar de definir cada regla manualmente, el sistema “aprende” cómo traducir las entradas en salidas. Deep Learning es una forma especializada de aprendizaje automático basada en redes neuronales artificiales con muchas capas de procesamiento (“deep” = profundo). Esta arquitectura permite detectar patrones muy complejos y ofrecer resultados precisos incluso en condiciones variables.
¿Cuáles son las ventajas de utilizar la IA en el control de calidad?
| Aspectos problemáticos del control manual | Solución basada en las ventajas del procesamiento de imágenes asistido por IA |
|---|---|
| Evaluación inconsistente de la calidad | Evaluación consistente y repetible basada en grandes conjuntos de datos |
| Margen de atención limitado | Funcionamiento continuo permanente sin fatiga |
| Documentación costosa de las decisiones | Almacenamiento automático de imágenes con representación de mapas de calor y valor de puntuación (Score) para una mayor transparencia y trazabilidad |
| Mayores costes de personal, escasez de personal y altos costes de formación | Escalable independientemente de la disponibilidad de personal, baja barrera de entrada gracias a un menor esfuerzo de formación |
|
Aspectos problemáticos del control manual
|
|||
|---|---|---|---|
|
Evaluación inconsistente de la calidad
|
Margen de atención limitado
|
Documentación costosa de las decisiones
|
Mayores costes de personal, escasez de personal y altos costes de formación
|
|
Solución basada en las ventajas del procesamiento de imágenes asistido por IA
|
|||
|
Evaluación consistente y repetible basada en grandes conjuntos de datos
|
Funcionamiento continuo permanente sin fatiga
|
Almacenamiento automático de imágenes con representación de mapas de calor y valor de puntuación (Score) para una mayor transparencia y trazabilidad
|
Escalable independientemente de la disponibilidad de personal, baja barrera de entrada gracias a un menor esfuerzo de formación
|
¿Cuándo se utilizan los sistemas de procesamiento de imágenes basados en reglas y cuándo los de IA ?
Ámbitos de aplicación típicos
Procesamiento de imágenes basado en reglas h4>
| Medición, tareas de medición |
| Lectura de códigos |
| Alineación y posicionamiento precisos (también Robot Vision, Robot Guidance) |
Combinaciones y solapamientos h4>
| Inspección, detección de defectos |
| Identificación (lectura de códigos, OCR/reconocimiento de caracteres) |
| Localización de objetos y características (también Robot Vision, Robot Guidance) |
Procesamiento de imágenes basadao en la IA h4>
| Detección de objetos muy variables o errores |
| OCR exigente (p. ej., mala calidad de impresión, fondos variables) |
| Localización de objetos con elevada varianza |
| Clasificación (p. ej. de materiales o texturas) |
¿Qué tecnologías de IA se utilizan en el procesamiento de imágenes?
Clasificación
Multi-Class: una clase por imagen, p. ej., “tornillo” h4>
Multi-Label: posibilidad de varias clases por imagen, p. ej., “tornillo”, “clavo” h4>
Detección de objetos
La detección de objetos localiza y clasifica varios objetos en la imagen mediante marcos delimitadores, los llamados Bounding Boxes. Para cada objeto encontrado, indica a qué clase pertenece y dónde se encuentra exactamente en la imagen. Hay que distinguir entre la detección de objetos “paralela a los ejes” (como se puede ver en la imagen) y la “orientada”. En la detección de objetos orientados, los cuadros delimitadores están alineados con el objeto y describen el Bounding Box más pequeño posible.
Segmentación
Asigna una clase a cada píxel individual de la imagen para la delimitación exacta de objetos (p. ej., clavo, tornillo, fondo) o defectos (p. ej., defectos de pintura).
Nota: Además de los modelos de IA habituales, cada vez hay más modelos de IA entrenados para una aplicación específica, como Deep OCR. El reconocimiento óptico de caracteres con Deep OCR utiliza redes neuronales entrenadas en grandes cantidades de imágenes de texto para extraer letras y números. A diferencia del OCR clásico, permite la detección precisa de texto dinámico con tamaños de fuente variables y diferentes fondos, incluso con impresiones y etiquetas con un diseño específico.
¿Qué es un modelo de IA?
Un modelo de IA está estructurado en capas: La “Input Layer” recibe los datos sin procesar (p. ej., imágenes). En las “Hidden Layers” se detectan automáticamente las características, y la “Output Layer” toma una decisión basada en ellas.
Durante el entrenamiento, el modelo de IA compara sus predicciones con la verdad fundamental y ajusta gradualmente las ponderaciones. Este proceso de aprendizaje se repite en muchos ejemplos hasta que el modelo de IA detecta patrones de forma fiable.
No todos los modelos de IA son una red neuronal. El término “modelo de IA” es un término genérico para muchos tipos de algoritmos, incluidos árboles de decisiones, modelos estadísticos y redes neuronales. Estos últimos son una forma de modelos de IA especialmente adecuados para tareas complejas como el reconocimiento de imágenes o el procesamiento de voz. Sin embargo, los términos “red neuronal” y “modelo de IA” se utilizan a menudo como sinónimos.
ONNX: el formato de intercambio universal
wenglor AI Loop: cómo funciona la IA en el procesamiento industrial de imágenes
¿Qué es importante a la hora de crear conjuntos de datos adecuados?
Una resolución más alta muestra más detalles, pero requiere más tiempo de entrenamiento y más recursos. Las imágenes del conjunto de datos se reducen a menudo, p. ej., a 320 × 320 píxeles (imagen de entrada de IA) para el entrenamiento.
Importante: La característica decisiva debe ser claramente detectable incluso con una resolución así de baja. Lo que es visible para el ojo humano también suele poder ser capturado por el modelo de IA.
Importante: La Augmentation debe seguir siendo realista y práctica, ya que su uso tiene una gran influencia a la hora de equilibrar la exactitud del modelo de IA. Un giro podría ser, por ejemplo, un caso de error y, por lo tanto, no es adecuado para todas las aplicaciones.
¿Cómo se puede minimizar el esfuerzo del proceso de etiquetado?
Consejo: Las muestras límite deben marcarse específicamente como tales mediante etiquetas. De este modo, esta información se puede incluir en la posterior validación de la red.
¿Qué hay que tener en cuenta al entrenar un modelo de IA?
Consejo: El entrenamiento repetido del modelo de IA con el mismo conjunto de datos puede dar lugar a diferentes valores de rendimiento. Unas diferencias superiores al 5 % indican un registro de datos inconsistente.
Cuanto mayor sea la resolución,
- mayor será el tiempo de evaluación,
- mayores los requisitos de la memoria RAM para la interferencia (ejecución),
- más larga la duración del entrenamiento
- más datos de entrenamiento se necesita para lograr el mismo equilibrio en la exactitud.
Trucos y consejos para la transparencia del modelo de IA
- Los datos de entrenamiento se utilizan para entrenar el modelo de IA, y suelen representar entre el 70 y el 80 % de los datos.
- Los datos de validación se utilizan durante el entrenamiento para ajustar las ponderaciones y comprobar si el modelo de IA está sobreentrenado (Overfitting). Suelen representar entre el 10 y el 20 % de los datos.
- Los datos de prueba solo se utilizan para evaluar la calidad final del modelo de IA, y representan entre el 10 y el 20 % de los datos.
| Característica | Validación del Hold-out (retención) | Validación K-Fold-Cross (validación cruzada K-Fold) |
|---|---|---|
| Descripción | El conjunto de datos se divide una sola vez, p. ej., 80 % de entrenamiento/20 % de prueba | El conjunto de datos se divide en k partes, el modelo de IA se evalúa k veces con cada uno de los otros datos de prueba |
| Ventajas |
|
|
| Desventajas |
|
|
¿Cómo se implanta la IA en la aplicación de procesamiento de imágenes?
- Aparecen nuevas clases que deben detectarse.
- Los valores de puntuación disminuyen, p. ej., debido a cambios de lote, contaminación o desgaste de los portapiezas o reducción de la potencia lumínica.
- Los requisitos de equilibrio en la exactitud cambian.
Comparación de tres enfoques básicos para el entrenamiento de modelos de IA
| Cloud (p. ej. AI Lab) | On-Premise | Edge | |
|---|---|---|---|
| Características | Nube alojada externamente | Nube corporativa, servidor, PC local | Localmente, directamente en el dispositivo en la producción |
| Complejidad de la aplicación | De sencillo a complejo | Individual | Sencilla |
| Control de costes | Pay-per-use (pago por uso), sin costes de adquisición de hardware de entrenamiento | Inversiones en hardware y costes operativos | Sin costes adicionales (funciona en dispositivos inteligentes) |
| Configuración y acceso | Sin necesidad de configuración especial, accesible a través de un navegador con conexión a Internet | Es necesario instalar y configurar un hardware de entrenamiento adecuado | Se ejecuta directamente en el hardware (p. ej., Smart Camera), requiere un navegador/software de terceros |
| Flexibilidad de entrenamiento | Gran flexibilidad, desde modelos de IA sencillos hasta complejos y conjuntos de datos pequeños a grandes
|
La responsabilidad recae en el operador | La flexibilidad del entrenamiento suele ser limitada
|
| Validación y trazabilidad | Validación estadísticamente sólida basada en grandes cantidades de datos centralizados | Validación estadísticamente sólida a partir de grandes cantidades de datos: el almacenamiento es responsabilidad del usuario | Comprobación manual sencilla del funcionamiento basándose en piezas individuales |
| Colaboración y gestión de conjuntos de datos | Administrable de forma centralizada y compatible con el trabajo en equipo | Depende de la configuración | Solución individual, sin verdadera colaboración ni control basado en roles |
| Escalabilidad | Escalable automáticamente a través de Cloudserver | Depende del operador (memoria, potencia de cálculo, solución de software) | Solo se puede ampliar mediante la adquisición adicional de dispositivos Edge |
| Disponibilidad y despliegue | Se puede utilizar de forma centralizada desde cualquier dispositivo Despliegue escalable: Despliegue de modelos de IA en múltiples líneas, ubicaciones o regiones |
Disponible localmente o dentro de la red | Disponible de forma descentralizada, en el hardware local o en la red (sin conexión) |
| Seguridad de los datos, control de acceso y copias de seguridad | Depende del proveedor de la nube, centralizada con roles de usuario y copias de seguridad | En función de la configuración, es responsabilidad del usuario | El almacenamiento local de datos es seguro, pero sin gestión centralizada de usuarios ni copias de seguridad automáticas |
|
Características
|
||
|
Cloud (p. ej. AI Lab)
Nube alojada externamente
|
On-Premise
Nube corporativa, servidor, PC local
|
Edge
Localmente, directamente en el dispositivo en la producción
|
|
Complejidad de la aplicación
|
||
|
Cloud (p. ej. AI Lab)
De sencillo a complejo
|
On-Premise
Individual
|
Edge
Sencilla
|
|
Control de costes
|
||
|
Cloud (p. ej. AI Lab)
Pay-per-use (pago por uso), sin costes de adquisición de hardware de entrenamiento
|
On-Premise
Inversiones en hardware y costes operativos
|
Edge
Sin costes adicionales (funciona en dispositivos inteligentes)
|
|
Configuración y acceso
|
||
|
Cloud (p. ej. AI Lab)
Sin necesidad de configuración especial, accesible a través de un navegador con conexión a Internet
|
On-Premise
Es necesario instalar y configurar un hardware de entrenamiento adecuado
|
Edge
Se ejecuta directamente en el hardware (p. ej., Smart Camera), requiere un navegador/software de terceros
|
|
Flexibilidad de entrenamiento
|
||
|
Cloud (p. ej. AI Lab)
Gran flexibilidad, desde modelos de IA sencillos hasta complejos y conjuntos de datos pequeños a grandes
|
On-Premise
La responsabilidad recae en el operador
|
Edge
La flexibilidad del entrenamiento suele ser limitada
|
|
Validación y trazabilidad
|
||
|
Cloud (p. ej. AI Lab)
Validación estadísticamente sólida basada en grandes cantidades de datos centralizados
|
On-Premise
Validación estadísticamente sólida a partir de grandes cantidades de datos: el almacenamiento es responsabilidad del usuario
|
Edge
Comprobación manual sencilla del funcionamiento basándose en piezas individuales
|
|
Colaboración y gestión de conjuntos de datos
|
||
|
Cloud (p. ej. AI Lab)
Administrable de forma centralizada y compatible con el trabajo en equipo
|
On-Premise
Depende de la configuración
|
Edge
Solución individual, sin verdadera colaboración ni control basado en roles
|
|
Escalabilidad
|
||
|
Cloud (p. ej. AI Lab)
Escalable automáticamente a través de Cloudserver
|
On-Premise
Depende del operador (memoria, potencia de cálculo, solución de software)
|
Edge
Solo se puede ampliar mediante la adquisición adicional de dispositivos Edge
|
|
Disponibilidad y despliegue
|
||
|
Cloud (p. ej. AI Lab)
Se puede utilizar de forma centralizada desde cualquier dispositivo
Despliegue escalable: Despliegue de modelos de IA en múltiples líneas, ubicaciones o regiones |
On-Premise
Disponible localmente o dentro de la red
|
Edge
Disponible de forma descentralizada, en el hardware local o en la red (sin conexión)
|
|
Seguridad de los datos, control de acceso y copias de seguridad
|
||
|
Cloud (p. ej. AI Lab)
Depende del proveedor de la nube, centralizada con roles de usuario y copias de seguridad
|
On-Premise
En función de la configuración, es responsabilidad del usuario
|
Edge
El almacenamiento local de datos es seguro, pero sin gestión centralizada de usuarios ni copias de seguridad automáticas
|