Probando los límites de precisión de AlphaFold2 i

Probando los límites de precisión de AlphaFold2 i

Figura 1

Imagen:

A: Estructuras superpuestas de tipo salvaje (gris) y mutante (color), experimental (naranja) y predicha (azul) de la proteína H-NOX. B: proteína de tipo salvaje con residuos coloreados por cepa (una medida de deformación conformacional). Si; Se indica el sitio de mutación (residuo 71 mutado de alanina (A) a glicina (G)). C: tensión, Si, cada residuo a lo largo de la secuencia de proteínas tanto para estructuras experimentales como predichas; La ubicación de la mutación se indica con una línea de puntos.

mirar Más

Crédito: Instituto de Ciencias Básicas

Investigadores del Centro de Materia Viva y Blanda del Instituto de Ciencias Básicas (Corea del Sur) exploraron recientemente los límites de la capacidad de AlphaFold2 AI para predecir estructuras de proteínas.

Las proteínas, los caballos de batalla de la biología, están codificadas por secuencias de ADN y son responsables de funciones importantes en las células. Desde que John Kendrew realizó la primera medición experimental de la estructura de las proteínas en la década de 1950, la capacidad de una proteína para plegarse en estructuras tridimensionales complejas ha sido durante mucho tiempo un tema de fascinación e importancia científica. Sin embargo, determinar estas estructuras experimentalmente ha seguido siendo un desafío formidable durante décadas.

El investigador del IBS, John M. McBride, dijo: «La secuenciación del ADN es un proceso mucho más simple que el análisis de las estructuras de las proteínas. Por ejemplo, comparemos el progreso de la investigación en el ADN y las proteínas. Hasta la fecha, hemos secuenciado cientos de millones de secuencias de ADN, en el Por otro lado, sólo hemos logrado caracterizar varios cientos de miles de estructuras proteicas.

Por lo tanto, un enfoque central de la biología computacional es predecir las estructuras de las proteínas a partir de sus secuencias. Comprender la estructura de una proteína es clave para descifrar sus funciones, estudiar enfermedades, desentrañar el envejecimiento y diseñar proteínas para diversas aplicaciones tecnológicas.

Google DeepMind ha extendido la aplicación de la inteligencia artificial al ámbito de la biofísica. AlphaFold2 de la compañía representa el último hito en la lucha contra el problema de la predicción de la estructura de las proteínas, cerrando la brecha entre las predicciones computacionales y la precisión experimental. Este logro es lo suficientemente sustancial como para declarar «resueltos» algunos problemas de predicción de la estructura de las proteínas.

Pero la pregunta es: ¿qué precisión tiene?

A pesar del éxito de AlphaFold2 en la predicción de estructuras de proteínas, persisten dudas sobre los límites de su precisión. Una preocupación fundamental surge cuando se intenta predecir los efectos de cambios muy pequeños en una proteína, por ejemplo, en una mutación puntual única en la que un solo aminoácido se reemplaza con diferentes propiedades químicas. Alcanzar este nivel de precisión es esencial para estudiar la enfermedad y la evolución.

Es dudoso que AlphaFold2 pueda lograr tal precisión. La base de datos oficial AlphaFold dice claramente: “AlphaFold no ha sido validado para predecir el efecto de las mutaciones. En particular, no se espera que alfafold produzca una estructura proteica desplegada dada una secuencia que contiene una mutación puntual desestabilizadora. Además, varias evaluaciones recientes no han logrado proporcionar evidencia de que se puedan predecir los efectos de la mutación alfa.

Los investigadores del SII utilizaron un enfoque doble para proporcionar una demostración sólida y completa de que alfafold puede predecir efectos mutacionales. Primero, validaron directamente las predicciones alfa comparándolas con estructuras experimentales. Los investigadores combinaron esto con la validación indirecta de las predicciones alfa.

Sin embargo, todo este proceso fue muy desafiante.

El primer obstáculo importante son los datos limitados que pueden utilizarse para realizar comparaciones. Aunque hay más de medio millón de estructuras en el Banco de Datos de Proteínas (PDB) público, sólo una pequeña fracción de ellas puede usarse para medir los efectos mutacionales. Después de una rigurosa selección de datos y control de varios factores, los investigadores se quedaron con sólo unos pocos miles de proteínas con estructuras experimentales que contenían pequeños cambios de aminoácidos. Estos datos también contenían un ruido aleatorio considerable, lo que dificultaba distinguir entre diferencias estructurales causadas por errores de medición y mutaciones.

A pesar de esto, los investigadores demostraron que los efectos mutacionales se pueden medir estadísticamente mediante diseños experimentales, lo que proporciona un método sólido para cuantificar estos efectos. Al aplicar este método, los investigadores demostraron que las predicciones de Alphafold eran tan precisas como las mediciones experimentales. Un segundo desafío implica la insuficiencia de las medidas típicas de similitud estructural para capturar las diferencias estructurales debidas a mutaciones. Las medidas convencionales, como la desviación cuadrática media (RMSD), explican principalmente los cambios en toda la estructura de la proteína, enmascarando pequeños efectos locales en las regiones mutadas. Las mediciones locales, como la prueba de diferencia de distancia local (LDDT), tienen baja resolución y su capacidad para capturar diferencias sutiles es limitada.

En respuesta, el equipo de investigación adoptó herramientas de la física, en particular los conceptos de mecánica continua, para medir la tensión en las proteínas, una medida natural de deformación. Probaron este método en mediciones de fluorescencia en varias proteínas fluorescentes. Se descubrió que la deformación en el sitio de unión del cromóforo alfa (que es importante para la fluorescencia) se puede predecir con precisión, lo que lleva a predicciones precisas de la fluorescencia en proteínas fluorescentes.

Dos años después del lanzamiento de AlphaFold2, todavía estamos explorando las limitaciones y riesgos de este nuevo y sorprendente algoritmo. Esta primera evaluación exitosa de alfafold para predecir efectos mutacionales allana el camino para investigaciones sobre enfermedades y desarrollo de fármacos, lo que conducirá a mejoras en la salud humana. La capacidad de predecir los efectos de las mutaciones puede mejorar el estudio de la evolución, utilizando la evolución dirigida para desarrollar nuevas enzimas para comprender (y revertir) la historia evolutiva de la vida. El futuro de la ciencia de las proteínas es realmente brillante.


Descargo de responsabilidad: AAAS y EurekAlert! ¡No somos responsables de la exactitud de los comunicados de prensa publicados en EurekAlert! Para uso de cualquier información por parte de organizaciones contribuyentes o a través del sistema EurekAlert.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *