Ahora, gracias a una colaboración entre investigadores del John Innes Centre y científicos computacionales de la Universidad de Exeter, se ha dado un paso gigantesco hacia la comprensión de este lenguaje. Hablamos de PlantRNA-FM, un modelo de Inteligencia Artificial (IA) revolucionario.
El equipo, liderado por la Profesora Yiliang Ding del John Innes Centre y el Dr. Ke Li de la Universidad de Exeter, entrenó a PlantRNA-FM con una base de datos masiva: 54 mil millones de piezas de información de ARN provenientes de 1,124 especies vegetales. Este conjunto de datos, equivalente a un gigantesco diccionario genético, permitió al modelo aprender las complejidades de la estructura y secuencia del ARN.
"Mientras que las secuencias de ARN pueden parecer aleatorias a simple vista, nuestro modelo de IA ha aprendido a decodificar los patrones ocultos dentro de ellas," explica el Dr. Haopeng Yu, investigador postdoctoral del grupo de la Profesora Ding.
La metodología empleada se asemeja a la del entrenamiento de modelos de lenguaje como ChatGPT, pero en lugar de texto humano, PlantRNA-FM aprendió el "idioma" de las plantas. El resultado: un modelo capaz de predecir con precisión las funciones del ARN e identificar patrones estructurales funcionales específicos en los transcriptomas. Estas predicciones, confirmadas mediante experimentos, muestran que las estructuras de ARN identificadas por PlantRNA-FM influyen en la eficiencia de la traducción de la información genética en proteínas.
Este proyecto, que contó con la participación de científicos de la Northeast Normal University y la Academia China de Ciencias, no solo representa un avance significativo en la comprensión de la biología vegetal, sino que también abre un abanico de posibilidades para la mejora de cultivos y el diseño de genes basado en IA. La Profesora Ding destaca que "PlantRNA-FM es solo el comienzo. Estamos trabajando en enfoques de IA más avanzados para entender los lenguajes ocultos del ADN y el ARN en la naturaleza".
La investigación continúa, explorando el potencial de este modelo para abordar desafíos globales en la agricultura y la biotecnología, prometiendo una nueva era en la comprensión y manipulación de la vida vegetal.