¿Qué es la segmentación de imágenes? ¿Cuáles son sus aplicaciones?
Si bien la detección y clasificación de objetos son dos factores importantes que influyen en el desarrollo de programas de video que funcionan sobre la base de la visión por ordenador, un tercer factor es la segmentación de imágenes. Un modelo de aprendizaje automático entrenado en un conjunto de datos de imágenes es capaz de reconocer categorías o características específicas dentro de dichas imágenes, pero estas deben primero ser segmentadas en diferentes regiones para que los objetos puedan ser detectados. Por ejemplo, un algoritmo de aprendizaje automático que está siendo entrenado para reconocer animales dentro de fotos que han sido tomadas en granjas debe ser capaz de diferenciar entre el animal y los árboles, herramientas, alimentos y otros objetos que puedan estar presentes en las imágenes.
¿Cómo funciona la segmentación de imágenes?
En términos sencillos, el objetivo de la segmentación de imágenes es resaltar los elementos en primer plano de una imagen concreta para facilitar a un algoritmo de aprendizaje automático la evaluación de objetos o información en dicha imagen. Dado que los softwares de reconocimiento de imágenes y detección de objetos funcionan sobre la base de la precisión, la segmentación de imágenes desempeña un papel importante a la hora de garantizar que estos algoritmos puedan funcionar de la forma más coherente y eficaz posible. Durante el proceso de segmentación de imágenes, a todos los elementos de la misma categoría dentro de la imagen se les asigna una etiqueta común.
Sigamos con el ejemplo de las fotografías tomadas en una granja. Todos los animales de estas imágenes se colocan en un mismo grupo, mientras que a las herramientas agrícolas, como tractores y palas, se les asigna una etiqueta diferente. Estas categorías individuales se introducen en un algoritmo de aprendizaje automático, ya que reconocer estos segmentos de imagen específicos dentro de una fotografía es mucho más fácil que reconocer un único elemento dentro de una imagen que contiene otros objetos. La segmentación de imágenes puede llevarse a cabo utilizando diferentes técnicas y enfoques.
Diferentes enfoques de la segmentación de imágenes
Dos enfoques habituales en la segmentación de imágenes son el de similitud y el de discontinuidad. El enfoque de similitud en la segmentación de imágenes consiste en detectar la similitud entre los píxeles de una imagen concreta para formar un segmento individual, de acuerdo con un umbral específico establecido de antemano. En cambio, el enfoque de discontinuidad se centra en identificar los valores de intensidad de los píxeles presentes en la imagen. Además, la segmentación de imágenes puede llevarse a cabo mediante diversas técnicas.
Técnicas de segmentación de imágenes
Las técnicas de segmentación de imágenes utilizan diferentes algoritmos de aprendizaje automático para identificar clases específicas de objetos e información que aparecen en las imágenes. Por ejemplo, los algoritmos de segmentación de imágenes Mask R-CNN producen tres salidas diferentes para cada objeto dentro de una imagen dada: la máscara de objeto de la imagen, la clase de la imagen y las coordenadas del cuadro delimitador. Por otro lado, los algoritmos de segmentación por detección de bordes aprovechan las características locales discontinuas de las imágenes para detectar los bordes de las mismas y definir los límites de un objeto concreto. Muchos desarrolladores de software combinan distintas técnicas de segmentación de imágenes para resolver problemas dentro de un ámbito específico.
Aplicaciones de la segmentación de imágenes
Dado que el proceso de segmentación de imágenes desempeña un papel crucial en el desarrollo de programas informáticos que utilizan técnicas de visión por ordenador, las aplicaciones de dicho proceso están muy extendidas. Por ejemplo, los sistemas de videovigilancia utilizan la segmentación de imágenes para identificar personas, vehículos, farolas y otros objetos dentro de las grabaciones de video. Por su parte, los profesionales de la salud recurren a la segmentación de imágenes cuando utilizan programas de imágenes médicas, ya que estos deben ser capaces de identificar elementos específicos del cuerpo humano. Además, los programas de redacción de video que se basan en técnicas de reconocimiento facial también funcionan de acuerdo con el proceso de segmentación de imágenes.
Mediante el proceso de segmentación de imágenes, los ingenieros de software han sido capaces de crear algoritmos de aprendizaje automático que pueden detectar desde tumores malignos en un órgano concreto del cuerpo humano hasta un semáforo en verde en una concurrida esquina de una bulliciosa ciudad estadounidense. En este sentido, la tecnología digital ha alterado realmente la forma en que los programas informáticos pueden interactuar con el mundo físico, pues las fotografías ya no se limitan a sus formas físicas. Hoy en día son muchas las aplicaciones de la segmentación de imágenes en el mundo empresarial y de seguro que en un futuro próximo se descubrirán nuevos usos para esta herramienta.