La investigación fue dirigida por Olga Troyanskaya en colaboración con Robert Darnell. Troyanskaya es subdirector de genómica del Centro de Biología Computacional (CCB) del Instituto Flatiron en la ciudad de Nueva York y profesor de informática en la Universidad de Princeton. Darnell es el Profesor Robert y Harriet Heilbrunn de Biología del Cáncer de la Universidad Rockefeller e investigador del Instituto Médico Howard Hughes.

Su equipo utilizó el aprendizaje automático para analizar los genomas completos de 1,790 individuos con autismo y sus padres y hermanos no afectados. Estos individuos no tenían antecedentes familiares de autismo, lo que significa que la causa genética de su afección fue probablemente mutaciones espontáneas en lugar de mutaciones hereditarias.

El análisis predijo las ramificaciones de las mutaciones genéticas en partes del genoma que no codifican proteínas, regiones que a menudo se caracterizan erróneamente como ADN «basura». El número de casos de autismo relacionados con las mutaciones no codificantes fue comparable al número de casos relacionados con las mutaciones codificantes de proteínas que desactivan la función del gen.

Las implicaciones del trabajo van más allá del autismo, dice Troyanskaya. «Esta es la primera demostración clara de mutaciones no hereditarias y no codificantes que causan cualquier enfermedad o desorden humano complejo.»

Los científicos pueden aplicar las mismas técnicas utilizadas en el nuevo estudio para explorar el papel que desempeñan las mutaciones no codificantes en enfermedades como el cáncer y las enfermedades cardiacas, dice el coautor del estudio Jian Zhou de CCB y Princeton. «Esto permite una nueva perspectiva sobre la causa no sólo del autismo, sino de muchas enfermedades humanas.»

Sólo entre el 1 y el 2 por ciento del genoma humano está compuesto de genes que codifican los planos para producir proteínas. Estas proteínas llevan a cabo tareas en todo nuestro cuerpo, como la regulación de los niveles de azúcar en la sangre, la lucha contra las infecciones y el envío de comunicaciones entre las células. El otro 98% de nuestro genoma no es peso muerto genético. Las regiones no codificantes ayudan a regular cuándo y dónde los genes producen proteínas.

Las mutaciones en las regiones con codificación de proteínas representan como máximo el 30 por ciento de los casos de autismo en individuos sin antecedentes familiares de autismo. La evidencia sugirió que las mutaciones que causan autismo también deben ocurrir en otras partes del genoma.

Descubrir qué mutaciones no codificantes pueden causar autismo es delicado. Un solo individuo puede tener docenas de mutaciones no codificantes, la mayoría de las cuales serán únicas para el individuo. Esto hace que el enfoque tradicional de identificar las mutaciones comunes entre las poblaciones afectadas sea inviable.

Troyanskaya y sus colegas adoptaron un nuevo enfoque. Ellos entrenaron un modelo de aprendizaje automático para predecir cómo una secuencia dada afectaría la expresión génica.

«Este es un cambio en el pensamiento sobre los estudios genéticos que estamos introduciendo con este análisis», dice Chandra Theesfeld, una científica investigadora del laboratorio de Troyanskaya en Princeton. «Además de los científicos que estudian mutaciones genéticas compartidas entre grandes grupos de individuos, aquí estamos aplicando un conjunto de herramientas inteligentes y sofisticadas que nos dicen qué va a hacer cualquier mutación específica, incluso aquellas que son raras o nunca antes observadas».

Los investigadores estudiaron la base genética del autismo aplicando el modelo de aprendizaje automático a un tesoro de datos genéticos llamado Simons Simplex Collection. La Fundación Simons, la organización matriz del Instituto Flatiron, produjo y mantiene el depósito. La Simons Simplex Collection contiene todos los genomas de casi 2.000 cuartetos compuestos por un niño con autismo, un hermano no afectado y sus padres no afectados.

Estos cuartetos no tenían antecedentes familiares previos de autismo, lo que significa que las mutaciones no hereditarias probablemente fueron responsables de la afección del niño afectado. (Estas mutaciones ocurren espontáneamente en los espermatozoides y los óvulos, así como en los embriones.)

Los investigadores usaron su modelo para predecir el impacto de las mutaciones no hereditarias y no codificantes en cada niño con autismo. Luego compararon esas predicciones con los efectos de la misma cadena no mutada en el hermano no afectado del niño.

«El diseño de la Simons Simplex Collection es lo que nos permitió hacer este estudio», dice Zhou. «Los hermanos no afectados son un control incorporado.»

El análisis sugirió que las mutaciones no codificantes en muchos de los niños con regulación genética alterada por el autismo. Además, los resultados sugirieron que las mutaciones afectaban la expresión génica en el cerebro y los genes ya vinculados al autismo, como los responsables de la migración y el desarrollo de las neuronas. «Esto es consistente con la forma en que el autismo se manifiesta más probablemente en el cerebro», dice el coautor del estudio Christopher Park, un científico investigador del CCB. «No es sólo el número de mutaciones que ocurren, sino qué tipo de mutaciones están ocurriendo.»

Los investigadores probaron los efectos de algunas de las mutaciones no codificantes en experimentos de laboratorio. Insertaron en las células mutaciones predichas de alto impacto que se encuentran en niños con autismo y observaron los cambios resultantes en la expresión génica. Estos cambios confirmaron las predicciones del modelo.

Troyanskaya dice que ella y sus colegas continuarán mejorando y ampliando su método. En última instancia, espera que el trabajo mejore la forma en que se utilizan los datos genéticos para diagnosticar y tratar enfermedades y trastornos. «En este momento, el 98 por ciento del genoma suele ser desechado», dice. «Nuestro trabajo te permite pensar en lo que podemos hacer con el 98%.»