Por The New York Times | Carl Zimmer
Dos décadas después de haber sido presentado con gran algarabía el esbozo de la secuencia del genoma humano, un equipo de 99 científicos finalmente lo ha descifrado por completo. Han llenado grandes vacíos y corregido una larga lista de errores en versiones anteriores, lo cual nos da un nuevo panorama de nuestro ADN.
En las últimas semanas, este equipo ha publicado seis artículos en línea en los que describen el genoma completo. Según los investigadores, esta información buscada con tanto ahínco, que ahora está en revisión por parte de las revistas científicas, les dará a los científicos un conocimiento más profundo de la manera en que el ADN influye en los riesgos de contraer ciertas enfermedades y de cómo las células lo mantienen en cromosomas muy bien organizados y no en laberintos moleculares.
Los investigadores han descubierto, por ejemplo, más de 100 nuevos genes que pueden ser funcionales y han identificado millones de variaciones genéticas entre las personas. Es posible que algunas de esas diferencias tengan algo que ver con las enfermedades.
Para Nicolas Altemose, un investigador de posdoctorado en la Universidad de California, campus Berkeley, que trabajó en el equipo, la imagen del genoma humano completo parece un acercamiento de Plutón en una fotografía tomada desde la sonda espacial New Horizons.
“Se pueden ver todos los cráteres y los colores de algo de lo que antes solo teníamos una idea muy confusa”, comentó. “Esto ha sido todo un sueño hecho realidad”.
Los especialistas que no participaron en el proyecto señalaron que esto permitirá que los científicos estudien el genoma humano con mucho mayor detalle. Ahora se han descifrado de una manera tan clara grandes trozos del genoma que solo habían estado vacíos, que los científicos pueden por fin comenzar a estudiarlos a fondo.
“Son asombrosos los frutos de este trabajo de secuenciación”, comentó Yukiko Yamashita, una bióloga del desarrollo en el Instituto Whitehead para la Investigación Biomédica del Instituto Tecnológico de Massachusetts.
Hace un siglo, los científicos sabían que los genes se distribuían en 23 pares de cromosomas, pero, en gran medida, estas extrañas estructuras microscópicas parecidas a un gusano seguían siendo un misterio.
Para fines de la década de 1970, los científicos ya tenían la capacidad de identificar unos cuantos genes por separado y descodificar su secuencia. Pero sus herramientas eran tan rudimentarias que encontrar un solo gen podía ocupar una carrera profesional entera.
Hacia finales del siglo XX, una red internacional de genetistas decidió intentar secuenciar todo el ADN de nuestros cromosomas. El Proyecto del Genoma Humano fue una empresa temeraria debido a todo lo que se tenía que secuenciar. Los científicos sabían que las dos cadenas del ADN de nuestras células contenían aproximadamente 3000 millones de pares de letras, un texto lo suficientemente largo como para llenar cientos de libros.
Cuando ese equipo comenzó su trabajo, la mejor tecnología que los investigadores podían usar secuenció trozos del ADN de una longitud de solo unas cuantas docenas de letras, o bases. Los científicos tenían que juntarlas como si fueran las piezas de un gran rompecabezas. Para armarlo, buscaron fragmentos con terminaciones idénticas, lo que significaba que venían de trozos del genoma que coincidían. Les llevó años armar poco a poco los fragmentos secuenciados para formar hileras más largas.
En el año 2000, la Casa Blanca anunció que los científicos habían terminado el primer esbozo del genoma humano y al año siguiente se publicaron los detalles del proyecto. Pero aunque los científicos trataban de dilucidar en qué parte encajaban otras millones de bases, largos tramos del genoma seguían sin conocerse.
Resultó que el genoma era un rompecabezas muy difícil de armar a partir de piezas pequeñas. Muchos de nuestros genes existen como copias múltiples que casi son idénticas unas a otras. En ocasiones, las copias diferentes llevan a cabo trabajos diferentes. Otras copias (conocidas como pseudogenes) están desactivadas como consecuencia de mutaciones. Un fragmento corto de ADN procedente de un gen podría encajar bien en otros.
Además, los genes solo constituían un pequeño porcentaje del genoma. El resto de este puede ser todavía más desconcertante. Gran parte del genoma está formado por tramos de ADN parecidos a los virus, los cuales existen en buena medida solo para hacer copias nuevas de ellos mismos que se vuelven a insertar en el genoma.
A principios de la década del año 2000, los científicos lograron armar mejor el rompecabezas del genoma a partir de sus diminutas piezas. Hicieron más fragmentos, los leyeron con mayor precisión y desarrollaron programas de computadora para ensamblarlos en trozos más grandes del genoma.
De manera periódica, los investigadores daban a conocer un bosquejo más reciente y mejor hecho del genoma humano, conocido como el genoma de referencia. Los científicos usaban el genoma de referencia como guía para sus propios trabajos de secuenciación. Por ejemplo, al comparar los genes de algunos pacientes con el genoma de referencia, los genetistas clínicos catalogaban las mutaciones causantes de enfermedades.
El genoma de referencia más reciente salió en 2013. Era mucho mejor que el primer esbozo, pero faltaba mucho para que estuviera completo; el ocho por ciento estaba vacío en su totalidad.
“Había faltado prácticamente todo un cromosoma humano”, mencionó Michael Schatz, un biólogo computacional de la Universidad Johns Hopkins.
En 2019, dos científicos —Adam Phillippy, un biólogo computacional del Instituto Nacional de Investigación del Genoma Humano, y Karen Miga, una genetista de la Universidad de California, campus Santa Cruz— fundaron la asociación Telomere-to-Telomere Consortium con el fin de completar el genoma. Esta asociación utilizó las nuevas computadoras que pueden leer tramos de ADN con una longitud de decenas de miles de bases. Los científicos también inventaron técnicas para averiguar a qué parte de un genoma pertenecían las secuencias especialmente desconcertantes que se repetían.
En resumidas cuentas, los científicos añadieron o corrigieron más de 200 millones de pares de bases del genoma de referencia. Ahora pueden decir con toda seguridad que el genoma humano tiene una longitud de 3050 millones de pares de bases.
Dentro de esas nuevas secuencias de ADN, los científicos descubrieron más de 2000 genes nuevos. Parecía que la mayoría estaban desactivados como consecuencia de mutaciones, pero, al parecer, 115 de estos pueden producir proteínas, cuya función los investigadores tardarían años en determinar. El consorcio ahora calcula que el genoma humano contiene 19.969 genes que codifican proteínas.
Ahora que ya está armado el genoma completo, los investigadores podrían analizar mejor la variación del ADN de una persona a otra. Descubrieron más de dos millones de sitios nuevos del genoma en los que las personas son diferentes. Usar el nuevo genoma también los ayudó a no identificar mutaciones relacionadas con enfermedades donde en realidad no existe ninguna.
“Es un avance enorme para esta disciplina”, señaló Midhat Farooqui, director de Oncología Molecular en el Hospital Infantil Mercy, un hospital de Kansas City, Misuri, quien no participó en el proyecto.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]