IMPORTANTE AVANCE CIENTÍFICO: DEEPMIND AI ALPHAFOLD RESUELVE EL GRAN DESAFÍO DE LA PREDICCIÓN DE LA ESTRUCTURA DE PROTEÍNAS DE HACE 50 AÑOS

DeepMind desarrolla una solución de inteligencia artificial para el desafío de las proteínas de 50 años, creando potencial para acelerar la investigación biológica.

En un importante avance científico, la última versión del sistema de inteligencia artificial AlphaFold de DeepMind ha sido reconocida como una solución al gran desafío de 50 años de la predicción de la estructura de proteínas, a menudo denominado el ‘problema de plegamiento de proteínas’, según un riguroso informe independiente evaluación. Este avance podría acelerar significativamente la investigación biológica a largo plazo, abriendo nuevas posibilidades en la comprensión de enfermedades y el descubrimiento de fármacos, entre otros campos.

Hoy, los resultados de CASP14 muestran que el último sistema AlphaFold de DeepMind logra niveles incomparables de precisión en la predicción de estructuras. El sistema es capaz de determinar estructuras de alta precisión en cuestión de días. CASP, la Evaluación Crítica de la Predicción de la Estructura de las proteínas, es una evaluación bienal administrada por la comunidad que comenzó en 1994 y el estándar de oro para evaluar las técnicas predictivas. Los participantes deben predecir ciegamente la estructura de las proteínas que solo recientemente, o en algunos casos aún no se han determinado experimentalmente, y esperar a que sus predicciones se comparen con los datos experimentales.

CASP utiliza la métrica “Prueba de distancia global (GDT)” para evaluar la precisión, que va de 0 a 100. El nuevo sistema AlphaFold alcanza una puntuación media de 92,4 GDT en general en todos los objetivos. El error promedio del sistema es de aproximadamente 1,6 Angstroms, aproximadamente el ancho de un átomo . Según el profesor John Moult, cofundador y presidente de CASP, una puntuación de alrededor de 90 GDT se considera informalmente competitiva con los resultados obtenidos de métodos experimentales.

El profesor John Moult, cofundador y presidente de CASP, Universidad de Maryland, dijo:

“Hemos estado estancados en este problema, cómo se pliegan las proteínas, durante casi 50 años. Ver a DeepMind producir una solución para esto, después de haber trabajado personalmente en este problema durante tanto tiempo y después de tantas paradas y empezar a preguntarse si alguna vez llegaríamos allí, es un momento muy especial “.

Por qué es importante la predicción de la estructura de las proteínas
Las proteínas son esenciales para la vida y sus formas están íntimamente ligadas a sus funciones. La capacidad de predecir las estructuras de las proteínas con precisión permite una mejor comprensión de lo que hacen y cómo funcionan. Actualmente hay más de 200 millones de proteínas en la base de datos principal y solo se ha cartografiado una fracción de sus estructuras 3D.

Un desafío importante es la cantidad astronómica de formas en que una proteína podría plegarse teóricamente antes de asentarse en su estructura 3D final. Muchos de los mayores desafíos a los que se enfrenta la sociedad, como el desarrollo de tratamientos para enfermedades o la búsqueda de enzimas que descompongan los desechos industriales, están fundamentalmente vinculados a las proteínas y al papel que desempeñan. La determinación de las formas y funciones de las proteínas es un campo importante de investigación científica, que utiliza principalmente técnicas experimentales que pueden llevar años de trabajo minucioso y laborioso por estructura, y requieren el uso de equipos especializados multimillonarios.

El enfoque de DeepMind al problema del plegamiento de proteínas
Este avance se basa en la primera entrada de DeepMind en CASP13 en 2018, donde la versión inicial de AlphaFold logró el nivel más alto de precisión entre todos los participantes. Ahora, DeepMind ha desarrollado nuevas arquitecturas de aprendizaje profundo para CASP14, inspirándose en los campos de la biología, la física y el aprendizaje automático, así como en el trabajo de muchos científicos en el campo del plegamiento de proteínas durante el último medio siglo.

Una proteína plegada se puede considerar como un “gráfico espacial”, donde los residuos son los nodos y los bordes conectan los residuos en estrecha proximidad. Este gráfico es importante para comprender las interacciones físicas dentro de las proteínas, así como su historia evolutiva. Para la última versión de AlphaFold utilizada en CASP14, DeepMind creó un sistema de red neuronal basado en la atención, entrenado de extremo a extremo, que intenta interpretar la estructura de este gráfico, mientras razona sobre el gráfico implícito que está construyendo. Utiliza secuencias evolutivamente relacionados, alineación de secuencias múltiples (MSA), y una representación de amino ácidos pares de residuos para perfeccionar este gráfico.

Al iterar este proceso, el sistema desarrolla fuertes predicciones de la estructura física subyacente de la proteína. Además, AlphaFold puede predecir qué partes de cada estructura de proteína predicha son confiables utilizando una medida de confianza interna.

El sistema se entrenó con datos disponibles públicamente que constan de ~ 170.000 estructuras de proteínas del banco de datos de proteínas, utilizando una cantidad relativamente modesta de procesamiento según los estándares modernos de aprendizaje automático: aproximadamente 128 núcleos TPUv3 (aproximadamente equivalentes a ~ 100-200 GPU) ejecutados unas pocas semanas.

Potencial de impacto en el mundo real
DeepMind está emocionado de colaborar con otros para aprender más sobre el potencial de AlphaFold, y el equipo de AlphaFold está investigando cómo las predicciones de la estructura de proteínas podrían contribuir a la comprensión de ciertas enfermedades con algunos grupos de especialistas.

También hay indicios de que la predicción de la estructura de las proteínas podría ser útil en futuros esfuerzos de respuesta a una pandemia, como una de las muchas herramientas desarrolladas por la comunidad científica. A principios de este año, DeepMind predijo varias estructuras de proteínas del virus SARS-CoV-2 , y el trabajo sorprendentemente rápido de los experimentadores ahora ha confirmado que AlphaFold logró un alto grado de precisión en sus predicciones.

AlphaFold es uno de los avances más importantes de DeepMind hasta la fecha. Pero al igual que con toda la investigación científica, todavía queda mucho por hacer, incluido averiguar cómo múltiples proteínas forman complejos, cómo interactúan con el ADN , ARN o moléculas pequeñas, y cómo determinar la ubicación precisa de todas las cadenas laterales de aminoácidos.

Al igual que con su anterior sistema CASP13 AlphaFold, DeepMind planea enviar un documento detallando el funcionamiento de este sistema a una revista revisada por pares a su debido tiempo, y simultáneamente está explorando la mejor manera de brindar un acceso más amplio al sistema de una manera escalable.

AlphaFold abre nuevos caminos al demostrar el asombroso potencial de la IA como herramienta para ayudar al descubrimiento científico fundamental. DeepMind espera colaborar con otros para desbloquear ese potencial.

Declaraciones de científicos independientes:
Profesor Venki Ramakrishnan, Premio Nobel y Presidente de la Royal Society
“Este trabajo computacional representa un avance asombroso en el problema del plegamiento de proteínas, un gran desafío de 50 años en biología. Ha ocurrido décadas antes de que muchas personas en el campo lo hubieran predicho. Será emocionante ver las muchas formas en que cambiará fundamentalmente la investigación biológica ”.

Profesora Dame Janet Thornton, Directora Emérita y Científica Senior, EMBL-EBI
“Lo que el equipo de DeepMind ha logrado es fantástico y cambiará el futuro de la biología estructural y la investigación de proteínas. Después de décadas de estudiar las proteínas, las moléculas que proporcionan la estructura y las funciones de todos los seres vivos, me desperté esta mañana con la sensación de que se han hecho progresos “.

Arthur D. Levinson, PhD, Fundador y CEO Calico, ex presidente y CEO de Genentech
“AlphaFold es un avance único en una generación, que predice estructuras de proteínas con una velocidad y precisión increíbles. Este salto adelante demuestra cómo los métodos computacionales están preparados para transformar la investigación en biología y son muy prometedores para acelerar el proceso de descubrimiento de fármacos ”.

Profesor Andrei Lupas, director del Instituto Max Planck de Biología del Desarrollo
“Los modelos asombrosamente precisos de AlphaFold nos han permitido resolver una estructura de proteína en la que estuvimos atrapados durante casi una década, relanzando nuestro esfuerzo por comprender cómo se transmiten las señales a través de las membranas celulares”.

Profesor Ewan Birney, Director General Adjunto EMBL, Director EMBL-EBI
“Casi me caigo de la silla cuando vi estos resultados. Sé lo riguroso que es CASP: básicamente garantiza que el modelado computacional debe funcionar en la desafiante tarea del plegamiento de proteínas ab-initio. Fue una lección de humildad ver que estos modelos podían hacer eso con tanta precisión. Habrá muchos aspectos que comprender, pero este es un gran avance para la ciencia ”.

Declaraciones de DeepMind / Alphabet:
Demis Hassabis, PhD, Fundador y CEO de DeepMind
“La visión fundamental detrás de DeepMind siempre ha sido construir IA y luego usarla para ayudar a ampliar nuestro conocimiento sobre el mundo que nos rodea acelerando el ritmo de los descubrimientos científicos. Para nosotros, AlphaFold representa un primer punto de prueba para esa tesis. Este avance es nuestro primer gran avance en un gran desafío científico de larga data, que esperamos tenga un gran impacto en el mundo real en la comprensión de la enfermedad y el descubrimiento de fármacos “.

Pushmeet Kohli, PhD, Jefe de Inteligencia Artificial para la Ciencia, DeepMind
“Estos increíbles resultados son testimonio de la filosofía de investigación única de DeepMind, que reúne a equipos multidisciplinarios centrados en la misión para alcanzar ambiciosos objetivos científicos. Las evaluaciones críticas como CASP son importantes para impulsar el progreso de la investigación, y esperamos seguir construyendo sobre este trabajo, profundizando nuestra comprensión de las proteínas y los mecanismos biológicos, y abriendo nuevas vías de exploración “.

John Jumper, PhD, AlphaFold Lead, DeepMind
“La biología de las proteínas es increíblemente compleja y desafía la caracterización simple. El trabajo de nuestro equipo demuestra que las técnicas de aprendizaje automático finalmente pueden satisfacer la complejidad de describir estas increíbles máquinas de proteínas, y estamos realmente emocionados de ver qué nuevos avances tanto en la salud humana como en la biología fundamental traerá “.

Kathryn Tunyasuvunakool, PhD, ingeniera científica, DeepMind
“La capacidad de predecir estructuras de proteínas de alta precisión con IA podría cambiar la forma en que abordamos la biología, con aplicaciones potenciales en el diseño de fármacos y la biorremediación. Particularmente para proteínas que desafían experimentalmente, buenas técnicas de predicción podrían marcar una gran diferencia “.

Sundar Pichai, director ejecutivo de Google y Alphabet
“Este es un avance increíble impulsado por la inteligencia artificial en el plegamiento de proteínas, que nos ayudará a comprender mejor uno de los bloques de construcción más fundamentales de la vida. Este gran avance desde DeepMind tiene implicaciones prácticas inmediatas, lo que permite a los investigadores abordar problemas nuevos y difíciles, desde la respuesta a una pandemia futura hasta la sostenibilidad ambiental “.

Para obtener más información sobre este tema, lea La solución de inteligencia artificial de DeepMind para un desafío científico de 50 años que podría “revolucionar la investigación médica” .

Sobre DeepMind

DeepMind es un equipo multidisciplinario de científicos, ingenieros, expertos en aprendizaje automático y más, que trabajan juntos para investigar y construir sistemas de inteligencia artificial seguros que aprenden cómo resolver problemas y promover el descubrimiento científico para todos.

Mejor conocido por desarrollar AlphaGo, el primer programa en vencer a un campeón mundial en el complejo juego de Go, DeepMind ha publicado más de 1000 artículos de investigación, incluidos más de una docena en Nature and Science, y logró resultados innovadores en muchos dominios desafiantes de IA de StarCraft II al plegamiento de proteínas.

DeepMind se fundó en Londres en 2010 y unió fuerzas con Google en 2014 para acelerar su trabajo. Desde entonces, su comunidad se ha expandido para incluir equipos en Alberta, Montreal, París y Mountain View en California.