Aprendizaje por conjuntos, IA y alumnos débiles y fuertes
December 05, 2024 | 4 minutes read
El aprendizaje por conjuntos se refiere a un enfoque de aprendizaje automático que se centra en el uso de múltiples algoritmos de aprendizaje automático para lograr un mejor rendimiento predictivo que el que se podría haber obtenido mediante la utilización de algoritmos individuales por sí solos. Dicho esto, el aprendizaje por conjuntos se basa en el concepto de “la sabiduría de la multitud”, según el cual un gran grupo de personas que pueden tener una cantidad media de conocimientos sobre un tema específico son capaces de proporcionar ciertas respuestas y conocimientos sobre este tema, debido en gran parte al gran número de personas que contribuyen al objetivo final, así como a la diversidad de estas personas. Es más, este grupo también puede actuar con mayor eficacia que un grupo más reducido de expertos altamente cualificados.
¿Cómo funciona el aprendizaje por conjuntos?
Para ilustrar cómo funciona el aprendizaje por conjuntos, pensemos en un desarrollador de software que quiere crear un algoritmo de aprendizaje automático capaz de detectar automáticamente rostros humanos en grabaciones de vídeo con una precisión del 95%. Para lograr este objetivo, el desarrollador en cuestión podría utilizar cuatro modelos de aprendizaje automático diferentes, incluyendo una red neuronal artificial, una máquina de vectores de soporte, un árbol de decisión y un modelo de regresión lineal. Sin embargo, después de que este desarrollador de software haya terminado de entrenar estos cuatro algoritmos diferentes, es posible que todos ellos no hayan alcanzado el umbral de precisión del 95% que se estableció al principio del proceso de desarrollo. Del mismo modo, estos cuatro algoritmos se clasificarían como aprendices débiles en el contexto del aprendizaje por conjuntos.
En este caso, en lugar de crear un quinto algoritmo de aprendizaje automático, el programador de este ejemplo podría combinar los cuatro algoritmos que ya ha desarrollado en un único modelo. A continuación, el desarrollador podría ejecutar sus entradas a través de este conjunto de algoritmos, y luego calcular el promedio de los resultados. Hasta este punto, este desarrollador podría utilizar este enfoque de entrenamiento por conjuntos para superar el umbral de precisión del 95% que estableció al inicio del proceso de desarrollo, sin necesidad de obtener datos de entrenamiento adicionales, y mucho menos de desarrollar otro algoritmo que pudiera obtener mejores resultados que los cuatro primeros algoritmos inicialmente. Posteriormente, este proceso es posible gracias a la distinta naturaleza de los algoritmos de aprendizaje automático que se utilizaron para crear el conjunto.
Volviendo al ejemplo de un gran grupo de personas con una cantidad media de conocimientos que supera a un pequeño grupo de expertos en una tarea concreta, la diversidad de los primeros significa que cubrirán los puntos débiles de los demás, mientras que el conocimiento especializado de los segundos significará inevitablemente que determinados factores no se tengan en cuenta en absoluto. Por ejemplo, una red neuronal artificial puede funcionar mejor en un determinado conjunto de datos de lo que lo habría hecho un árbol de decisión. Aunque estos puntos débiles se ponen de manifiesto cuando los algoritmos se utilizan por separado, pueden cubrirse cuando se juntan en un conjunto, en el que una mano lava a la otra.
Retos del aprendizaje por conjuntos
A pesar de las numerosas ventajas del aprendizaje por conjuntos, también hay algunos inconvenientes notables asociados a este enfoque. En particular, la creación de 4 algoritmos de aprendizaje automático diferentes puede ser un proceso extremadamente largo y costoso, ya que muchos desarrolladores de software no podrán permitirse tales esfuerzos. A la inversa, otro problema que surge cuando se utiliza el enfoque de aprendizaje por conjuntos en el aprendizaje automático es la transparencia y la explicabilidad. También conocida como IA de caja negra, puede ser difícil determinar por qué un algoritmo de aprendizaje automático que ha sido entrenado utilizando el enfoque de conjuntos ha llegado a una decisión concreta, ya que combinar un árbol de decisión, una red neuronal artificial, una máquina de vectores de soporte y un modelo de regresión lineal haría casi imposible entender la lógica que ha llevado a un resultado o decisión concretos.
Como en el caso de muchas otras técnicas y métodos que se utilizan actualmente en el ámbito del aprendizaje automático, la mejor forma de ver el aprendizaje por conjuntos es como una herramienta que puede utilizarse para resolver problemas extremadamente matizados y complejos. Incluso sin tener en cuenta el tiempo necesario para entrenar cuatro modelos diferentes de aprendizaje automático, los recursos necesarios para financiar este tipo de desarrollo estarían fuera del alcance de la inmensa mayoría de la población general. Sin embargo, para aquellos que pueden permitirse financiar un enfoque de este tipo, el aprendizaje conjunto puede dar a los desarrolladores de software el empujón extra que necesitan para alcanzar objetivos que, de otro modo, parecerían fuera de su alcance.