iconoCientíficos españoles del CSIC han desarrollado una herramienta de inteligencia artificial que predice nuevas funciones desconocidas de las proteínas

Un grupo de científicos españoles desarrolla una herramienta de IA que predice funciones de proteínas desconocidas

ZIP

A partir de secuencias genómicas, un equipo liderado por Rosa Fernández y Ana Rojas ha creado Fantasia, que predice funciones de proteínas ocultas en el proteoma oscuro, analizando cerca de 1.000 genomas con alta precisión.

Un grupo de científicos españoles ha desarrollado una innovadora herramienta de inteligencia artificial llamada Fantasia (Functional ANnoTation based on embedding space SImilArity), que tiene la capacidad de predecir funciones de proteínas desconocidas a partir de secuencias genómicas. Este proyecto ha sido liderado por Rosa Fernández, del Instituto de Biología Evolutiva (IBE) y la Universidad Pompeu Fabra (UPF), junto con Ana Rojas, del Centro Andaluz de Biología del Desarrollo (CABD) y también de la UPF. Ambas investigadoras forman parte de un centro mixto del Consejo Superior de Investigaciones Científicas (CSIC).

La herramienta Fantasia puede analizar un genoma animal completo en cuestión de horas en un ordenador convencional, o en solo 30 minutos en un equipo especializado. Gracias a su capacidad para trabajar con Big Data, ha permitido a los investigadores asignar funciones a 24 millones de genes codificantes de proteínas del proteoma oscuro, analizando cerca de 1.000 genomas animales con una precisión cercana al 100%. Esto es crucial, ya que la mayoría de las proteínas en el proteoma oscuro carecen de homólogos de referencia y permanecen ocultas.

El proteoma es fundamental para entender cómo se sintetizan las proteínas en cualquier organismo. Aunque en humanos se conoce el funcionamiento de entre el 80% y el 90% de las proteínas, en otros mamíferos y en invertebrados, esta cifra es significativamente menor. Este desconocimiento puede llevar a la pérdida de datos esenciales sobre la evolución de las especies y su salud. Hasta ahora, la principal forma de predecir funciones era mediante la comparación con genes similares, un método que limita la exploración de este vasto universo.

La innovadora metodología de Fantasia traduce las secuencias de ADN en fragmentos y los analiza sintácticamente, como si fueran frases. Cada fragmento recibe un valor numérico, lo que permite al sistema construir una gramática para anticipar lo que falta, similar a un procesador de texto. Este enfoque permite a la IA aprender de miles de ejemplos ya estudiados, identificando funciones de proteínas y su papel en procesos biológicos.

La estudiante de doctorado del IBE, Gemma Martínez Redondo, destaca que Fantasia es un software abierto y fácil de usar, accesible incluso para usuarios sin experiencia en programación. Incluye modelos ya entrenados y se adhiere a los principios de sostenibilidad, permitiendo su uso sin necesidad de superordenadores.

¿Y SI LA SOLUCIÓN A NUESTROS MISTERIOS PROTEICOS ESTUVIERA EN UNA SIMPLE HUELLA DIGITAL MATEMÁTICA?

Scroll al inicio
Verificado por MonsterInsights