Un equipo de investigadores del Consejo Superior de Investigaciones Científicas (CSIC) se ha inspirado en el comportamiento de las hormigas faraón para mejorar un algoritmo de inteligencia artificial que tiene aplicaciones en la búsqueda de fármacos y la optimización de la gestión logística, entre otros sectores. Esta especie posee un comportamiento que les permite aprender de ejemplos negativos.
Es sabido que las hormigas dejan a su paso un rastro de feromonas, lo que permite al resto del hormiguero seguir la misma ruta. Rutas más cortas al nido permiten un paso más frecuente de hormigas: en consecuencia, acumulan mayor rastro de feromonas y quedan reforzadas positivamente frente a las otras rutas. Esto permite a la comunidad de hormigas hallar un camino muy corto.
Este es un ejemplo de la inteligencia de enjambre de comportamientos colectivos de animales como las hormigas, las abejas o las termitas, que inspira desarrollos de inteligencia artificial. De hecho, la técnica ACO (del inglés ant colony optimization) se basa en la forma en que las hormigas encuentran caminos cortos y tiene aplicaciones en logística, investigación médica o bioinformática.
Ahora, científicos del Instituto de Investigación en Inteligencia Artificial del CSIC (IIIA-CSIC) han mejorado la técnica ACO inspirándose en las hormigas faraón. Christian Blum, científico del IIIA-CSIC que ha dirigido el trabajo, explica: “El tipo de aprendizaje usado en ACO se limita a aprender de ejemplos positivos. Sin embargo, aprender de ejemplos negativos parece jugar un papel importante en sistemas biológicos autoorganizados”.
Las hormigas faraón (Monomorium pharaonis) -explica Blum- “utilizan feromonas de rastro negativo para desplegar señales de no-entrada para marcar caminos de alimentación poco gratificantes”.
En el trabajo, del cual también es firmante el estudiante de doctorado Teddy Nurcahyadi, han diseñado el primer mecanismo general para incorporar el aprendizaje negativo de forma beneficiosa en la técnica ACO. Publicado en el congreso ANTS 2020 de Barcelona, uno de los principales del área, el trabajo fue premiado como mejor artículo por su gran potencial de innovación.
Combina aprendizaje positivo y negativo
En el estudio, los científicos han modificado el algoritmo ACO para que incorpore el aprendizaje basado en ejemplos negativos. “El aprendizaje negativo complementa el positivo, que sigue siendo el más importante. Pero en nuestro artículo mostramos que los dos juntos resultan en un algoritmo superior “.
Nuestros algoritmos son iterativos, explica Blum. Es decir, se ejecutan las mismas instrucciones repetidamente una y otra vez. “En cada iteración es como si hubiera un cierto número de hormigas que, cada una, genera una posible solución válida al problema que se quiere resolver”.
Si en la naturaleza las hormigas se guían, de forma probabilista, por las feromonas que hallan en cada trozo de camino, en los algoritmos esas feromonas equivaldrían a valores numéricos que están en los componentes de las posibles soluciones. Y al igual que las feromonas, esos valores se refuerzan positivamente o negativamente en función de si aparecen o no en las soluciones buenas.
Este tipo de algoritmo se puede aplicar a numerosos problemas de optimización. Situaciones en las que hay muchas posibles soluciones y se trata de encontrar la mejor o, por lo menos, una que sea “lo suficientemente buena», dice el investigador, como en el caso de la combinación de moléculas para la búsqueda de nuevos fármacos o la logística. “La investigación en muchos campos no sería posible sin herramientas adecuadas de optimización”, concluye Blum.
La investigación se desarrolla dentro de un proyecto del Plan Nacional de I+D+i denominado CI-Sustain: Inteligencia computacional avanzada para alcanzar objetivos de desarrollo sostenible.
Mercè Fernandez Via / CSIC Comunicación Cataluña