El artículo «A Comparative Study of the Characterisation of Colour Cameras by Means of Neural Networks and Polynomial Transforms» de Cheung, Vien; Westland, Stephen; Connah, David; y Ripamonti, Caterina, publicado en enero de 2004, explora técnicas avanzadas para la caracterización de cámaras de color, comparando redes neuronales artificiales (ANNs) y transformaciones polinomiales. Esta comparación surge de la necesidad creciente en el mercado de dispositivos de imagen de bajo costo de transferir imágenes entre distintos dispositivos sin perder la fidelidad del color, utilizando valores tristímulo CIE como referencia estándar.
El estudio aborda la dependencia de dispositivo y del iluminante que afecta a las cámaras digitales, las cuales capturan valores de RGB específicos a las condiciones de luz y a la cámara en uso. Esto genera la necesidad de convertir los valores de RGB de la cámara a los valores de RGB de un monitor para un correcto despliegue de la imagen. La caracterización se define como la relación entre las coordenadas del dispositivo (RGB o CMYK) y un espacio de color independiente del dispositivo, como el CIE XYZ, lo cual simplifica las transformaciones necesarias entre diferentes dispositivos de imagen.
El artículo destaca dos métodos numéricos para este proceso: las transformaciones polinomiales y las redes neuronales. Se utilizó una cámara Agfa StudioCam y dos muestras de colores (el Macbeth ColorChecker DC con 166 parches y 50 muestras de NCS) para el entrenamiento y prueba de los modelos. La linealización y corrección espacial de la respuesta de la cámara se lograron utilizando métodos polinomiales para corregir los valores RGB antes de su posterior procesamiento.
Para los métodos polinomiales, se evalúan tanto transformaciones lineales como no lineales, siendo estas últimas más comunes en la práctica. Se emplearon diferentes órdenes de polinomios, y se determinó que el rendimiento en pruebas alcanzó un mínimo para las transformaciones polinomiales de tercer orden, con el error de generalización estable excepto cuando el tamaño de la muestra de entrenamiento era muy reducido.
Las ANNs, específicamente las redes de perceptrón multicapa, se utilizaron para realizar mapeos entre respuestas de cámara y valores tristímulo, ajustando los pesos de las conexiones para reducir la diferencia entre los vectores de salida actuales y los deseados. Las redes neuronales demostraron un rendimiento similar a las transformaciones polinomiales en términos de error cromático mediano, aunque presentan ciertos desafíos, como requerir largos tiempos de entrenamiento y la posibilidad de no converger a un mínimo global.
Una desventaja notable de las redes neuronales es la lentitud en el entrenamiento, que en algunos casos puede superar una hora, mientras que los modelos polinomiales se resuelven en fracciones de segundo. Además, las redes neuronales pueden no siempre converger a un mínimo global de error, mientras que los polinomios ofrecen una implementación de entrenamiento y prueba más sencilla y confiable. Por tanto, el estudio concluye que las transformaciones polinomiales son una mejor alternativa para la caracterización de cámaras debido a su simplicidad y menor demanda computacional comparativa.
En resumen, aunque ambas técnicas muestran un rendimiento de colorimetría muy similar y adecuado, la simplicidad y eficacia de las transformaciones polinomiales las hacen más ventajosas para la caracterización de cámaras de color, especialmente dadas las complejidades y demandas de tiempo envolviendo el uso de redes neuronales.