La publicación de un "borrador" de la secuenciación del genoma humano en 2001 fue un momento trascendental. Desencadenó un cambio profundo en nuestra comprensión de genética Humano. Allanó el camino para avances notables en el estudio de la biología y en el tratamiento de enfermedades.
Sin embargo, algunas secciones no habían obtenido la secuencia y otra información era incorrecta. Exactamente dos décadas después, obtuvimos una nueva versión. Fue publicado como preimpresión por un consorcio internacional de investigadores. Aún no ha sido revisado por pares, pero finalmente parece "completo".
Secuenciación: ¿por qué tardamos tanto?
Las limitaciones tecnológicas han limitado la secuenciación del genoma humano solo a la porción "eucromática" del genoma, el 92% de nuestro genoma donde se encuentran la mayoría de los genes. Básicamente, el sector más activo en la producción de productos genéticos como ARN y proteínas.
La nueva secuenciación debería llenar los vacíos restantes, proporcionando los 3.055 mil millones de pares de bases ("letras") de nuestro código de ADN en su totalidad. Los datos se ponen a disposición del público, con la esperanza de que otros investigadores los utilicen para promover su investigación.
La parte heterocromática
Gran parte del material recién secuenciado es la parte "heterocromática" del genoma, que está más "empaquetada" que el genoma eucromático y contiene muchas secuencias altamente repetitivas que son muy difíciles de leer con precisión.
Alguna vez se pensó que estas regiones no contenían ninguna información genética importante, pero ahora se sabe que contienen genes involucrados en procesos fundamentales como la formación de órganos durante el desarrollo embrionario. Entre los 200 millones de pares de bases recién secuenciados hay alrededor de 115 genes que se espera estén involucrados en la producción de proteínas.
Dos factores clave hicieron posible este gran logro:
Una celda muy especial
La secuencia del genoma recientemente publicada se creó utilizando células humanas derivadas de un tipo de tejido muy raro llamado rueda hidatiforme. Afección que se presenta cuando un óvulo fertilizado pierde todo el material genético que le da su madre. La mayoría de las células contienen dos copias de cada cromosoma, una de cada padre y el cromosoma de cada padre que contribuye a una secuencia de ADN diferente. Una célula de una mola hidatiforme completa. sólo tiene dos copias de los cromosomas de su padre y la secuencia genética de cada par de cromosomas es idéntica.
Esto hizo que la secuenciación completa del genoma fuera mucho más fácil de armar.
Muchos, muchos avances en la tecnología de secuenciación
Después de décadas de progreso muy lento, el Proyecto Genoma Humano alcanzó su punto de inflexión en 2001 al allanar el camino para un método llamado "secuenciación de escopeta". Implicó romper el genoma en fragmentos muy pequeños de aproximadamente 200 pares de bases, clonar dentro de la bacteria para descifrar sus secuencias y luego volver a armar como un rompecabezas gigante.
Esta es la razón principal por la que el borrador de secuenciación original solo cubría las regiones eucromáticas del genoma: solo estas regiones podrían secuenciarse de manera confiable usando "la escopeta".
La última secuencia se logró utilizando dos nuevas tecnologías de secuenciación de ADN complementarias. Una fue desarrollado por PacBio y le permite secuenciar fragmentos de ADN más largos con una precisión muy alta.
El segundo, desarrollado por Nanopore de Oxford, produce tramos muy largos de secuencia continua de ADN. Estas nuevas tecnologías permiten que las piezas del rompecabezas tengan miles o incluso millones de pares de bases, lo que facilita su ensamblaje.
La nueva información tiene el potencial de mejorar nuestra comprensión de la biología humana, incluida la forma en que los cromosomas funcionan y mantienen su estructura. También mejorará nuestra comprensión de afecciones genéticas como el síndrome de Down, que tienen una anomalía cromosómica subyacente.
¡Vamos, pero ahora el genoma está completamente secuenciado!
Mmm no. Ni siquiera ahora.
Una omisión obvia es el cromosoma Y, porque las células molares hidatiformes utilizadas para compilar la secuenciación contenían solo dos copias idénticas del cromosoma X. Pero este trabajo está en curso, y los investigadores predicen que su método también puede secuenciar con precisión el cromosoma Y, a pesar de tienen secuencias muy repetitivas.
Sin embargo, todavía queda camino por recorrer
Si bien la secuenciación del genoma (casi) completo de una célula humana es un punto de referencia realmente impresionante, es solo uno de varios pasos cruciales para comprender completamente la diversidad genética humana. El próximo trabajo consistirá en estudiar los genomas de diferentes poblaciones (las células molares hidatiformes completas eran europeas).