Figura 1. A: Estructuras superpuestas de tipo salvaje (gris) y mutante (color), experimental (naranja) y predicha (azul) de la proteína H-NOX. B: cepa (una medida de deformación conformacional), se indica la ubicación de la mutación Si (residuo 71 mutado de alanina (A) a glicina (G)). C: cepa, Si, por residuo en la secuencia de proteínas para estructuras experimentales y predichas; La ubicación de la mutación se indica con una línea de puntos. Crédito: Cartas de revisión física (2023) DOI: 10.1103/PhysRevLett.131.218401
Las proteínas, los caballos de batalla de la biología, están codificadas por secuencias de ADN y son responsables de funciones importantes en las células. Desde que John Kendrew realizó la primera medición experimental de la estructura de las proteínas en la década de 1950, la capacidad de una proteína para plegarse en estructuras tridimensionales complejas ha sido durante mucho tiempo un tema de fascinación e importancia científica. Sin embargo, determinar estas estructuras experimentalmente ha seguido siendo un desafío formidable durante décadas.
El investigador del IBS, John M. McBride, dijo: «La secuenciación del ADN es un proceso más simple que el análisis de las estructuras de las proteínas. Por ejemplo, comparemos el progreso de la investigación en el ADN y las proteínas. Hasta la fecha, hemos secuenciado cientos de millones de secuencias de ADN. Por otro lado , sólo hemos logrado caracterizar cientos de miles de estructuras proteicas».
Por lo tanto, un enfoque central de la biología computacional es predecir las estructuras de las proteínas a partir de sus secuencias. Comprender la estructura de una proteína es clave para descifrar sus funciones, estudiar enfermedades, desentrañar el envejecimiento y diseñar proteínas para diversas aplicaciones tecnológicas.
Google DeepMind ha extendido la aplicación de la inteligencia artificial al ámbito de la biofísica. AlphaFold2 de la compañía representa el último hito en la lucha contra el problema de la predicción de la estructura de las proteínas, cerrando la brecha entre las predicciones computacionales y la precisión experimental. Este logro es lo suficientemente sustancial como para declarar «resueltos» algunos problemas de predicción de la estructura de las proteínas.
Pero la pregunta es: ¿qué precisión tiene?
A pesar del éxito de AlphaFold2 en la predicción de estructuras de proteínas, persisten dudas sobre los límites de su precisión. Una preocupación fundamental surge cuando se intenta predecir los efectos de cambios muy pequeños en una proteína, por ejemplo, en una mutación puntual única en la que un solo aminoácido se reemplaza con diferentes propiedades químicas. Alcanzar este nivel de precisión es esencial para estudiar la enfermedad y la evolución.
Es dudoso que AlphaFold2 pueda lograr tal precisión. La base de datos oficial AlphaFold establece claramente: «AlphaFold no ha sido validado para predecir el efecto de las mutaciones. En particular, no se espera que AlphaFold produzca una estructura proteica desplegada dada una secuencia que contiene una mutación puntual desestabilizadora». Además, varias evaluaciones recientes no han logrado proporcionar evidencia de que se puedan predecir los efectos de la mutación alfa.
Investigadores del Centro de Materia Viva y Blanda del Instituto de Ciencias Básicas (Corea del Sur) exploraron recientemente los límites de la capacidad de AlphaFold2 AI para predecir estructuras de proteínas. El equipo utilizó un enfoque doble para proporcionar una demostración sólida y completa de que alphafold puede predecir efectos mutacionales. Primero, validaron directamente las predicciones alfa comparándolas con estructuras experimentales. Los investigadores combinaron esto con la validación indirecta de las predicciones alfa.
Figura 2. Se muestra la estructura de una proteína fluorescente azul, coloreada según qué tan bien se correlaciona la cepa en cada residuo con la fluorescencia. Los átomos del residuo de triptófano (Y65) que se unen al cromóforo se muestran mediante esferas. La deformación en este residuo, SY65, da como resultado una disminución de la fluorescencia en dos pasos. Crédito: Cartas de revisión física (2023) DOI: 10.1103/PhysRevLett.131.218401
Sin embargo, todo este proceso fue muy desafiante.
El primer obstáculo importante son los datos limitados que pueden utilizarse para realizar comparaciones. Aunque hay más de medio millón de estructuras en el Banco de Datos de Proteínas (PDB) público, sólo una pequeña fracción de ellas puede usarse para medir los efectos mutacionales. Después de una rigurosa selección de datos y control de varios factores, los investigadores se quedaron con sólo unos pocos miles de proteínas con estructuras experimentales que contenían pequeños cambios de aminoácidos. Estos datos también contenían un ruido aleatorio considerable, lo que dificultaba distinguir entre diferencias estructurales causadas por errores de medición y mutaciones.
A pesar de esto, los investigadores demostraron que los efectos mutacionales se pueden medir estadísticamente mediante diseños experimentales, lo que proporciona un método sólido para cuantificar estos efectos. Al aplicar este método, los investigadores demostraron que las predicciones de Alphafold eran tan precisas como las mediciones experimentales.
Un segundo desafío implica la insuficiencia de las medidas típicas de similitud estructural para capturar las diferencias estructurales debidas a mutaciones. Las medidas convencionales, como la desviación cuadrática media (RMSD), explican principalmente los cambios en toda la estructura de la proteína, enmascarando pequeños efectos locales en las regiones mutadas. Las mediciones locales, como la prueba de diferencia de distancia local (LDDT), tienen baja resolución y su capacidad para capturar diferencias sutiles es limitada.
En respuesta, el equipo de investigación adoptó herramientas de la física, en particular los conceptos de mecánica continua, para medir la tensión en las proteínas, una medida natural de deformación. Probaron este método en mediciones de fluorescencia en varias proteínas fluorescentes. Se descubrió que la deformación en el sitio de unión del cromóforo alfa (que es importante para la fluorescencia) se puede predecir con precisión, lo que lleva a predicciones precisas de la fluorescencia en proteínas fluorescentes.
Dos años después del lanzamiento de AlphaFold2, todavía estamos explorando las limitaciones y riesgos de este nuevo y sorprendente algoritmo. Esta primera evaluación exitosa de alfafold para predecir efectos mutacionales allana el camino para investigaciones sobre enfermedades y desarrollo de fármacos, lo que conducirá a mejoras en la salud humana. La capacidad de predecir las consecuencias de las mutaciones puede mejorar el estudio de la evolución, utilizando la evolución dirigida para desarrollar nuevas enzimas y comprender la historia evolutiva de la vejez. El futuro de la ciencia de las proteínas es realmente brillante.
El trabajo está publicado en la revista. Cartas de revisión física.
Más información:
John M. McBride et al., Alphafold2 puede predecir efectos de mutación única, Cartas de revisión física (2023) DOI: 10.1103/PhysRevLett.131.218401
Proporcionado por el Instituto de Ciencias Básicas.
referencia: Prueba de los límites de la precisión de AlphaFold2 en la predicción de la estructura de las proteínas (22 de noviembre de 2023) Consultado el 22 de noviembre de 2023 en https://phys.org/news/2023-11-limits-alphafold2-accuracy-protein.html
Este documento está sujeto a derechos de autor. Ninguna parte puede reproducirse sin permiso por escrito, excepto en cualquier trato justo con fines de estudio o investigación privados. El contenido se proporciona únicamente con fines informativos.