jonathan d. Grinstein, Ph.D.
Patricia Brennan habla sobre la misión de la ciencia y la tecnología en la Iniciativa Chan Zuckerberg (CZI), tratando de alcanzar el mismo nivel de convicción que el presidente John F. La legendaria propuesta de Kennedy en mayo de 1961 para que Estados Unidos lograra «llevar un hombre a la luna y devolverlo sano y salvo a la Tierra» antes de que terminara la década.
«Nuestra misión es curar, prevenir y gestionar todas las enfermedades para finales de siglo», dijo Brennan, vicepresidente de ciencia y tecnología de CZI. Borde GEN.
La frase no es exactamente nueva, ya que es una repetición de un eslogan similar que se encuentra en el sitio web y la literatura de CZI: “¿Se curarán, prevendrán o controlarán todas las enfermedades para finales de este siglo? Eso esperamos. «
El 19 de septiembre de 2023, CZI anunció la financiación y la creación de uno de los sistemas informáticos más grandes del mundo dedicado a la investigación de ciencias biológicas sin fines de lucro, que incluirá más de 1000 GPU y permitirá inteligencia artificial (IA) y modelos de lenguaje de gran tamaño (LLM). ) para la biomedicina a escala.
El anuncio del CZI no llegó a tanta gente como otra referencia histórica al alunizaje: “Un pequeño paso para el hombre, un salto gigante para la humanidad” de Neil Armstrong en julio de 1969, visto por millones de personas en todo el mundo con la cara hacia arriba. Pegados a los televisores, los posibles éxitos pueden llegar aún más lejos.
Tríada de IA
La IA generativa, las herramientas de aprendizaje automático (ML), como los grandes modelos lingüísticos (LLM) y los modelos fundamentales, como lo ejemplifica ChatGPT de OpenAI, están arrasando en los mundos de la ciencia, la tecnología y la cultura popular. En biología y medicina, estas herramientas de aprendizaje automático ya están realizando tareas importantes para los científicos, identificando variables importantes dentro de patrones complejos y grandes cantidades de datos, para respaldar avances significativos en el descubrimiento de fármacos, la genética y la medicina de precisión.
«Algunos dicen que la biología es, en muchos aspectos, un desafío o esfuerzo computacional», dijo Brennan. Esta línea fue acuñada hace años por el biofísico estadounidense y experto en el origen de la vida Harold Morowitz, Ph.D.: “La informática es a la biología lo que la física es al cálculo. Es una técnica matemática natural que mapea mejor el carácter del sujeto.
En general, todas las aplicaciones de IA, ya sean biomedicina, robótica o economía, se basan en la misma tríada: datos, algoritmos y potencia informática. En los últimos años, CZI ha logrado avances en algoritmos y datos, ejemplificados por su trabajo en imágenes y biología unicelular.
Con la plataforma CELL by GENE (CELLxGENE), CZI está trabajando con los beneficiarios y la comunidad científica en general para agregar, cuantificar, integrar, seleccionar y actualizar datos unicelulares para capacitar a los investigadores con un conjunto de datos unificado y en crecimiento de más de 50 millones. Las células no se pueden comparar con otras, sino que dedican enormes recursos a construir sus propios conjuntos de datos.
«Lo que hemos visto es que no sólo esta idea de agregar datos y generalizarlos, sino también ponerlos a disposición, hacer que todo el corpus esté disponible y facilitar el uso del modo consultable realmente ha estimulado el desarrollo de nuevos modelos e investigaciones. en diferentes áreas», dijo Brennan. «Los investigadores estamos buscando pasar al análisis a nivel de atlas, llamado análisis a nivel de datos, donde analizan atlas de tejidos u otros conjuntos de datos agregados».
Otras fuentes de datos incluyen recursos producidos por instituciones de investigación científica de la República Checa. Chan Zuckerberg creó el Atlas OpenCell de localización e interacción de proteínas de BioHub San Francisco y el Atlas celular Tabula Sapiens. Mientras tanto, el Instituto Chan Zuckerberg de Imágenes Biológicas Avanzadas (CZ Imaging Institute) genera grandes conjuntos de datos de células con resolución molecular.
El equipo de ciencia y tecnología de CZI ha estado y continúa involucrado en el desarrollo de software de inteligencia artificial. Una de esas herramientas es CellGuide, una enciclopedia interactiva gratuita que proporciona información crítica sobre más de 700 tipos de células y subtipos de células diferentes utilizando definiciones generadas por ChatGPT. Estos incluyen definiciones, conjuntos de datos relacionados, visualización de árboles de ontología extensible de linajes celulares y genes marcadores computacionales y canónicos.
Además, en colaboración con el equipo de ciencia y tecnología de CZI, el CZ Imaging Institute está desarrollando un portal de código abierto basado en la nube para interrogar datos organizados de experimentos de tomografía crioelectrónica (cryoET).
«Durante los últimos cinco años, he visto un enorme progreso en la predicción de las propiedades de moléculas individuales», afirmó Nicholas Sofroniv, PhD, director de tecnología de productos de CZI. «Podemos plegar una sola proteína, pero ¿cómo encajan estas proteínas en las células? Eso es aún menos conocido allí. Por lo tanto, las mediciones con CryoET, donde se observan proteínas nativas en el entorno nativo, podrían ser parte del próximo ola de algoritmos de IA y ML con los que luego podemos guiar a toda la comunidad para que estas cosas estén disponibles y puedan desarrollarse.
Pero según Sofroniew, la brecha entre los recursos computacionales disponibles para los académicos individuales y el pequeño número de laboratorios de investigación tecnológica es demasiado grande. CZI cerrará esa brecha y ayudará a resolver problemas que los investigadores no están preparados para abordar en este momento, dijo Sofroniv.
«Existe un espacio realmente único que abarca los tipos de problemas que podemos abordar y las formas en que podríamos querer resolverlos, así como los tipos y escalas de computación que podemos aportar. En este tipo de problemas, se está volviendo más restrictivo para biología computacional», afirmó Sofroniv.
Potenciar la ciencia básica
De alguna manera, CZI está aprovechando este impulso tanto desde la perspectiva de la concesión de subvenciones como de la tecnología para abordar datos complejos, ya que ya está ganando terreno en la obtención de imágenes y la comprensión de datos unicelulares. El año pasado, contrató al biofísico de la Universidad de Stanford, Stephen Quake, PhD, como nuevo jefe científico de CZI, tras la decisión del exjefe Cory Bargman, PhD, de regresar a su laboratorio en la Universidad Rockefeller.
Aunque gran parte del enfoque de CZI se basa en gran medida en la investigación básica, tienen planes de trabajar con investigadores que analizan aplicaciones y comprenden los mecanismos de las enfermedades. Sin embargo, la contribución de CZI a la cura, prevención y tratamiento de enfermedades para finales de siglo no se realizará directamente mediante el descubrimiento o el desarrollo de terapias.
«Muchas compañías farmacéuticas están muy interesadas en la IA y la biología en este momento, y hay mucha inversión en diseño relacionado con medicamentos», dijo Sofroniv. «No vamos a trabajar en los mismos problemas. CZI se centra en habilitar herramientas, tecnologías y datos que avancen y potencien descubrimientos científicos adicionales. No estamos en el sector farmacéutico ni vamos a entrar en él.
El objetivo de CZI es pensar en la misión a largo plazo y quiere desarrollar tecnología a través de datos, modelos y aplicaciones que permita a los científicos ir más rápido y producir más ciencia.
«Los desafíos (de la biología) toman mucho tiempo y se enfrentan mejor combinando una combinación de desarrollo de software, ciencia básica e investigación científica, e identificando oportunidades para la concesión de subvenciones y financiación especial», dijo Brennan. «Con todos los avances, ya sea en grandes modelos de lenguaje o simplemente en potencia computacional y de cálculo en los últimos meses o años, vemos una oportunidad para unir esto».