«Handbook of Image Processing and Computer Vision: Volume 1: From Energy to Image» por Arcangelo Distante y Cosimo Distante, publicado por Springer International Publishing en 2020, ofrece una exploración exhaustiva de los fundamentos de la visión artificial, desde la energía hasta la formación de la imagen digital. El libro aborda cómo los sistemas inteligentes, influenciados por la intersección de la física, la tecnología de la información y la cibernética, pueden transformar la información capturada del entorno en representaciones digitales interpretables por máquinas.
El volumen se organiza de manera que facilita la comprensión progresiva de los conceptos, iniciando con una explicación de la propagación de la luz y la teoría de la percepción del color, y abarcando posteriormente los impactos del sistema óptico y la transducción de energía luminosa en señales eléctricas, hasta la conversión de éstas en valores discretos denominados píxeles. Estos primeros capítulos cubren la adquisición simbólica de una escena tridimensional, representada numéricamente mediante la proyección bidimensional de la imagen digital .
Se profundiza luego en la información geométrica, topológica, de calidad y perceptual de la imagen digital. Se definen métricas y modalidades de agregación y correlación entre píxeles, útiles para delinear estructuras simbólicas de la escena de nivel superior. La organización de datos para distintos niveles de procesamiento también es presentada .
Uno de los puntos clave del libro es la descripción de algoritmos de procesamiento de imágenes, cuya finalidad es mejorar las cualidades visuales de las imágenes mediante operadoras puntuales, locales y globales, tanto en el dominio espacial como en el de las frecuencias. Estos algoritmos son comparados en términos de carga computacional y efectividad visual mediante diversos ejemplos .
El libro también incluye técnicas avanzadas como las transformaciones lineales fundamentales, que permiten extraer características esenciales de las imágenes, y las transforma para mejorar la calidad visual, atenuar ruidos o reducir la dimensionalidad de los datos. También se detallan las transformaciones geométricas necesarias para corregir distorsiones geométricas introducidas durante la adquisición, o para generar efectos visuales específicos, basándose en algoritmos de restauración de imágenes degradadas, que corrigen cuantitativamente las imágenes para compensar las degradaciones durante la adquisición y transmisión .
En una sección crítica, el manual aborda la segmentación de imágenes, donde diferentes algoritmos dividen la imagen en regiones homogéneas y describen procedimientos para detectar automáticamente estructuras significativas, conocidas como puntos de interés, en la imagen. Estos puntos son cruciales para el reconocimiento de objetos y estructuras en la escena, más aún cuando las imágenes variaron en condiciones de iluminación u observación .
El texto concluye con una descripción de paradigmas en visión 3D, donde se analizan las imágenes 2D para reconstruir escenas tridimensionales usando múltiples cámaras o secuencias de imágenes temporales. Examina también la teoría de la forma basada en la sombreado, un método para reconstruir la forma de una superficie 3D visible usando solo la información de variación de brillo en la imagen. Adicionalmente, se explican técnicas de análisis de movimiento que permiten derivar el movimiento tridimensional casi en tiempo real a partir de secuencias de imágenes .
En suma, este libro integra un cúmulo de conocimientos interdisciplinarios y prácticas de investigación extensa, ofreciendo una guía detallada y técnica sobre cómo los sistemas inteligentes pueden percibir y actuar en su entorno, proporcionando una herramienta esencial para investigadores y profesionales en la visión artificial y el procesamiento de imágenes.