Plegar el futuro: cómo la IA está remodificando la ingeniería de proteínas

Plegar el futuro: cómo la IA está remodificando la ingeniería de proteínas

Después del nacimiento de la biotecnología, los investigadores están a punto de desarrollar buenas proteínas: enzimas que conservan su función a altas temperaturas, anticuerpos que unen objetivos con un millón de especificaciones, o proteínas fuertes, livianas, más ligeras, más ligeras y estructuradas. Las máquinas biológicas, proteínas y aminoácidos de la naturaleza se pliegan en formas complejas y funcionales como origami. La función de la proteína está determinada por su estructura, dependiendo de la secuencia de aminoácidos.

Los científicos visuales de las proteínas personalizadas de ingeniería han atraído durante mucho tiempo a los científicos con características y funciones especificadas mediante el diseño de una secuencia de aminoácidos específica. El problema es que la secuencia de proteínas de la ubicación se mide prácticamente, y la tarea sisipiana es tratar de diseñar una proteína para realizar una función específica. Durante décadas, los ingenieros de proteínas han evolucionado tareas como la termostabilidad enzimática o el sustrato, han utilizado un método de evolución en el LLAB. Alternativamente, intentan racionalizar las tareas deseadas al ver la estructura de la proteína (3D obtenida por microscopía crioelectrónica) e intentan averiguar qué áreas proteicas deben cambiarse, luego hacer cientos de variantes diferentes y probarlas en el laboratorio.

Las visualizaciones de la estructura de proteínas ayudan a los científicos a comprender cómo las secuencias de aminoácidos dictan la función, pero hasta hace poco, requiere un laborioso experimento y un error para diseñar estas estructuras. (EMW/Wikimedia CC BY-SA 3.0)

A medida que la inteligencia artificial continúa convirtiendo la ingeniería de proteínas, la conferencia de biología sintética global de este año se converge por igual. Los presentadores destacan cómo estas herramientas computacionales son rápidamente impulsores de la innovación en todo el panorama de la biología sintética.

Revolución Alfafold

Teniendo en cuenta la naturaleza laboriosa e ineficaz de las proteínas de ingeniería en el laboratorio, el sector ha sido mucho tiempo para el cambio de imagen computacional. Sin embargo, hasta alrededor de 2018, la energía computacional requerida para resolver la estructura de la proteína se considera incapaz de lograr. En 1969, el biólogo molecular Cyrus Levinthal estima que la proteína antigua puede doblarse en una proteína 10 de longitud típica, porque se sabe que resuelve el problema del plegamiento de proteínas.300 Configuraciones potenciales. Pero eso no significa que nadie pueda probarlo.

Desde finales de la década de 1980, los científicos han desarrollado modelos basados ​​en física molecular, tratando de descubrir las reglas del plegamiento de proteínas. Para comparar qué tan bien funcionan los diferentes modelos, los investigadores establecieron una evaluación crítica del desafío desafiante (CASP) para la competencia de pronóstico de la estructura de proteínas, que comenzó en 1994. Durante la competencia, los equipos intentan resolver la estructura de la proteína basada en sus modelos y comparar esas pronósticos con estructuras prácticamente determinadas.

La mayoría de los primeros modelos, como Rosetta, se basaron en la física en la Universidad de Washington, Nobel David Baker, que se desarrolló en 2024. Aunque estos modelos pueden describir con precisión las fuerzas termodinámicas que impulsan el plegamiento de proteínas, el bruto-for the Force no tiene potencia computacional.300 Configuraciones potenciales. El desarrollo de algoritmos de aprendizaje profundo a principios de 2010 es un momento importante para el pronóstico de formación de proteínas. En 2018, el equipo de Depmin, un laboratorio de inteligencia artificial del Reino Unido, compró Google en 2014, ingresó a la decimotercera competencia CASP con Alfafold. Para la próxima competencia en 2020, el algoritmo, revisado por DeepMind, dejó todos los demás modelos en el polvo.

Alphafold, quien ganó el Premio Nobel 2024 para sus investigadores en Química, es un progreso real en el pronóstico de plegado de proteínas. Alffffold es un modelo basado en la red nerviosa que aumenta las estructuras de proteínas con precisión nuclear sin la necesidad de energía computacional para los modelos basados ​​en la física. Para hacer eso, el algoritmo primero busca datos genéticos para las mismas secuencias de proteínas y crea un ensamblaje multiformal. Luego, produce un par de representación para codificar las relaciones espaciales entre los aminoácidos. La información como un par revisado se transporta a través de la red Transformer y proporciona el pronóstico final de la estructura de la proteína.

Alpfaffold, desarrollado por Deep Mind, revolucionó la biología constructiva utilizando el aprendizaje profundo para aumentar las estructuras de proteínas con precisión a nivel nuclear. (Doll-E)

Esta herramienta de IA ha revolucionado la biología, permitiendo el diseño, la fuerza y ​​la sostenibilidad de las nuevas proteínas. Desde 2020, Alphafold se ha utilizado para hacer millones de estructuras de proteínas, que hacen olas en la comunidad científica. . El último modelo Alphaffold 3 está disponible de forma gratuita para el uso de la investigación no comercial, lo que hace que la democracia de la ingeniería de proteínas no diera al ined hace una década.

Más allá del Alfafold

Después del progreso del alfffold, otros modelos de IA han sido desarrollados por laboratorios académicos y compañías de biotecnología, en las que la estructura y la función de la proteína están agitando, así como el plegamiento de otros tipos nucleares (ADN y ARN), y el modelo del patrón entre proteínas y sus ligandos.

RFDefusion es un modelo construido en un algoritmo original abierto llamado Rosettopold, desarrollado por David Bakers Lab. Produce nuevas estructuras de proteínas, ya que produce arte muñeco e o midzorny. Esta herramienta pudo abordar nuevos desafíos de diseño, incluida la unión molecular y el diseño de oligómeros. Tanto Rosettopold como RFDFusion se han actualizado a versiones totalmente paramédicas desde entonces, lo que permite complejos biológicos hechos de varias moléculas, no solo el modelado de proteínas sino también ADN, ARN, moléculas pequeñas, metales y otros átomos unidos.

Como modelos de lenguaje grandes como ChatGPT toman el mundo, los científicos se dieron cuenta de que también puedes usarlos para proteínas, y esta es la técnica más exitosa. Estos modelos gigantescos, entrenados en una amplia gama de datos, no se basan en la estructura de proteínas para los científicos, sino que permite la producción de diseños D novo basados ​​en la función. Estos dispositivos, también conocidos como modelos de lenguaje de proteínas (PLMS), son más accesibles para los investigadores porque es muy fácil sintonizar un modelo de lenguaje natural que desarrollar algoritmos tradicionales de aprendizaje automático.

El progreso en la IA productiva para el diseño de proteínas definitivamente no ha terminado. Los investigadores aún están trabajando para revisar los algoritmos para crear mejores proteínas para aplicaciones específicas, así como extender las capacidades de lo que es posible para la biología en IA. El mes pasado, Nvidia Jenmol fue un modelo de base para la producción molecular. Jenmole ofrece un marco productivo multimolecular basado en una transmisión separada y una decodificación auto-adquirida para facilitar el descubrimiento de drogas Shara desde la transmisión separada y el diseño de moléculas para avanzar en la optimización.

Diseño productivo en biología sintética

Entonces, ¿qué significa esto para la biología sintética y la economía biológica?

Las enzimas diseñadas por IA ya se están utilizando para mejorar los procesos industriales, desde la producción de alta calor hasta el plástico, lo que mejora el rendimiento y la sostenibilidad. (Doll-E)

El sueño de diseñar proteínas personalizadas es finalmente cierto. Por ejemplo, podemos hacer nuevas enzimas que sean estables a altas temperaturas. El uso de enzimas deterioradas en procesos industriales de alta temperatura (que fabrican papel con pulpa de madera) se traduce en millones de dólares de ahorros. AI Drug Sha Dobrets está revolucionando la investigación al permitir a los científicos dar forma a cómo las proteínas y los fármacos pequeños interactúan con sus objetivos. Además, podemos diseñar proteínas que no tienen igualdad en la naturaleza, nos ayuda a resolver los desafíos del siglo XXI.

Empresas como la cuna están utilizando modelos de lenguaje de proteínas para diseñar buenas enzimas, proteínas y anticuerpos de enlace al consumidor, en todo el espectro de biotecnología, desde la biofarmma industrial y de alimentos hasta biofarmma. D Novo está convirtiendo la tubería de descubrimiento biológico ABSI al habilitar el diseño de anticuerpos. Y los modelos Ginkgo son capaces de mejorar la actividad de la enzima petasa capaz de inferior al plástico.

Al igual que el último informe mejorado de biotecnología para sostenible (AB4S), la biotecnología avanzada reduce las emisiones globales en un 5% y puede ganar TR 1 billón en los alimentos, la agricultura, los productos químicos, el cuidado personal y el combustible de transporte. Con la base principal en la biotecnología del fabricante AI, la conversión del mundo a través de la biología sintética ya no es un sueño imposible, solo está en progreso.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *