La materia oscura digital que nubla la IA en el análisis del genoma

La materia oscura digital que nubla la IA en el análisis del genoma

La inteligencia artificial que nubla la materia oscura digital

Visualización de la corrección de gradiente. Logotipo de secuencia del mapa de prominencia no corregido (fila superior), ángulos de gradiente en cada posición (segunda fila) y mapa de prominencia corregido (tercera fila) para un parche de secuencias de prueba representativas. a, b CNN-deep-relu entrenado para hacer predicciones binarias en datos sintéticos y b Datos de ChIP-seq para la proteína ATF2 en GM12878. Se muestra el logotipo de secuencia de la realidad del terreno para CNN-deep-exp para datos sintéticos. b Se muestra un mapa de prominencia promedio de conjunto en lugar de la realidad del terreno (fila inferior). c–e Se hace un gráfico similar para el modelo ac DeepSTARR entrenado para predecir la actividad del potenciador a través de datos STARR-seq, el modelo d Basset entrenado para hacer predicciones binarias de sitios de accesibilidad a la cromatina a través de datos DNase-seq, y el modelo CNN entrenado para predecir base-seq. Resolución de valores de cobertura de lectura de datos ATAC-seq en la línea celular PC-3. c–e Se muestra un cuadro de color y un logotipo de secuencia correspondiente de un motivo conocido de JASPAR (con una ID correspondiente) para comparar. Crédito: biología del genoma (2023). DOI: 10.1186/s13059-023-02956-3

La inteligencia artificial ha entrado en nuestra vida diaria. Primero, fue ChatGPT. Ahora, son comerciales de pizza y cerveza generados por IA. Si bien no podemos confiar en que la IA sea perfecta, resulta que a veces tampoco podemos confiar en nosotros mismos con la IA.

El profesor asistente del Laboratorio Cold Spring Harbor (CSHL), Peter Koo, descubrió que los científicos que utilizan herramientas computacionales populares para interpretar las predicciones de IA están captando demasiado «ruido» o información adicional al analizar el ADN. Y ha encontrado una manera de arreglar esto. Ahora, con solo un par de nuevas líneas de código, los científicos pueden obtener explicaciones más confiables de las poderosas IA conocidas como redes neuronales profundas. Eso significa que pueden continuar persiguiendo las características genuinas del ADN. Esas características podrían indicar el próximo avance en la salud y la medicina. Pero los científicos no verán las señales si son ahogadas por demasiado ruido.

Entonces, ¿qué causa el ruido entrometido? Es una fuente misteriosa e invisible como la «materia oscura» digital. Físicos y astrónomos creen que la mayor parte del universo está lleno de materia oscura, un material que ejerce efectos gravitatorios pero que nadie ha visto todavía. De manera similar, Koo y su equipo descubrieron que los datos en los que se está entrenando la IA carecen de información crítica, lo que genera importantes puntos ciegos. Peor aún, esos puntos ciegos se tienen en cuenta al interpretar las predicciones de la IA sobre la función del ADN. El estudio se publica en la revista biología del genoma.

Koo dice: «La red neuronal profunda está incorporando este comportamiento aleatorio porque aprende una función en todas partes. Pero el ADN está solo en un pequeño subespacio de eso. E introduce mucho ruido. Y así mostramos que este problema en realidad introduce un mucho ruido en una amplia variedad de modelos destacados de IA».

La materia oscura digital es el resultado de que los científicos tomen prestadas técnicas computacionales de la IA de visión artificial. Los datos de ADN, a diferencia de las imágenes, se limitan a una combinación de cuatro letras de nucleótidos: A, C, G, T. Pero los datos de imágenes en forma de píxeles pueden ser largos y continuos. En otras palabras, le estamos dando a AI una entrada que no sabe cómo manejar adecuadamente.

Al aplicar la corrección computacional de Koo, los científicos pueden interpretar los análisis de ADN de AI con mayor precisión.

Koo dice: «Terminamos viendo sitios que se vuelven mucho más nítidos y limpios, y hay menos ruido espurio en otras regiones. Los nucleótidos únicos que se consideran muy importantes desaparecen de repente».

Koo cree que la perturbación del ruido afecta más que los analizadores de ADN alimentados por IA. Él piensa que es una aflicción generalizada entre los procesos computacionales que involucran tipos similares de datos. Recuerda, la materia oscura está en todas partes. Afortunadamente, la nueva herramienta de Koo puede ayudar a sacar a los científicos de la oscuridad a la luz.

Más información:
Antonio Majdandzic et al, Corrección de interpretaciones basadas en gradientes de redes neuronales profundas para genómica, biología del genoma (2023). DOI: 10.1186/s13059-023-02956-3

Proporcionado por el Laboratorio de Cold Spring Harbor

Citación: La inteligencia artificial que nubla la materia oscura digital en el análisis del genoma (5 de junio de 2023) recuperado el 6 de junio de 2023 de https://phys.org/news/2023-06-digital-dark-clouding-ai-genome.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *