Un estudio pionero, publicado en ACM’s Journal on Computing and Cultural Heritage y llevado a cabo por científicos del Instituto de Física Interdisciplinar y Sistemas Complejos, centro mixto del Consejo Superior de Investigaciones Científicas y la Universidad de las Islas Baleares (IFISC, CSIC-UIB), ha demostrado que las técnicas de Inteligencia Artificial (IA) son capaces de distinguir los distintos géneros flamencos (palos) analizando únicamente el vocabulario de sus letras. La investigación, que aplica el Procesamiento del Lenguaje Natural y el aprendizaje automático sobre más de 2.000 letras, valida el conocimiento tradicional y propone un enfoque cuantitativo para la conservación de este patrimonio cultural inmaterial.
Este novedoso estudio aporta nuevas perspectivas sobre la evolución cultural e histórica del flamenco, arrojando luz sobre cómo se distinguen los distintos géneros a través del lenguaje. La investigación explora la estructura oculta tras la tradición oral del flamenco, con implicaciones para la conservación del patrimonio cultural y las humanidades digitales.
Los investigadores del IFISC Pablo Rosillo-Rodes, Maxi San Miguel y David Sánchez analizaron más de 2.000 letras de flamenco y aplicaron un método de aprendizaje automático que utiliza métricas basadas en frecuencias de palabras para predecir la categoría de un texto y distinguir diferentes palos basándose únicamente en su contenido léxico (es decir, basado en palabras).
«Descubrimos que, además del ritmo y la tonalidad, el propio léxico contiene información suficiente para clasificar las canciones en su palo correcto con una alta precisión», explica Rosillo-Rodes, autor principal del estudio e investigador doctoral en el IFISC. El investigador añade: «Este enfoque cuantitativo no solo valida el conocimiento tradicional, sino que también desvela nuevas relaciones entre los estilos flamencos».
Patrones léxicos en el flamenco
Utilizando técnicas de lingüística computacional y análisis de redes, los investigadores identificaron palabras características de cada género y trazaron las relaciones entre estilos.
«Por ejemplo, observamos los estrechos vínculos históricos conocidos entre soleá y bulerías, y entre tientos y tangos, solo a partir de las letras», añade David Sánchez, investigador principal y profesor titular del IFISC.
El estudio también revela patrones culturales profundos. Por ejemplo, las letras asociadas a las seguiriyas son ricas en vocabulario relacionado con el dolor y la espiritualidad, mientras que las alegrías destacan temas de celebración y geografía, en particular referencias a la ciudad de Cádiz. «El lenguaje del flamenco codifica las experiencias vividas, las luchas y las celebraciones de sus comunidades», afirma el profesor emérito del IFISC Maxi San Miguel.
Además, el estudio construye un «árbol de relaciones» entre los principales palos mediante el cálculo de distancias léxicas y la aplicación de técnicas de análisis de redes. En este árbol, las bulerías emergen como un nodo central que conecta diferentes ramas estilísticas, como los cantes malagueños (fandangos y malagueñas) y los estilos considerados más puros y gitanos (seguiriyas y soleá).
Puente entre inteligencia artificial y patrimonio cultural
Este trabajo representa el primer análisis computacional a gran escala de letras de flamenco y abre nuevas puertas a la investigación de la música tradicional. «Aplicando el aprendizaje automático al patrimonio cultural inmaterial, podemos preservar y comprender mejor las complejas historias que encierran las tradiciones orales», concluye Rosillo-Rodes.
Al tender un puente entre el patrimonio cultural y la inteligencia artificial, este estudio ofrece potentes herramientas para preservar y comprender mejor una de las tradiciones musicales más emblemáticas de España, reconocida por la UNESCO como parte del Patrimonio Cultural Inmaterial de la Humanidad.

















