top of page

Conceptos Clave en Secuenciación de Próxima Generación (NGS)


La secuenciación de próxima generación (Next Generation Sequencing, NGS) ha cambiado para siempre la genética y la biología molecular, permitiendo una comprensión más profunda del ADN y el ARN.


¿Qué es la secuenciación NGS?

Desde su introducción, NGS ha superado ampliamente las capacidades de la secuenciación tradicional, conocida como secuenciación de Sanger. A diferencia de los métodos anteriores, NGS permite la secuenciación simultánea de millones de fragmentos de ADN, lo que reduce significativamente el tiempo y los costos, a la vez que aumenta la cantidad de datos generados.


La tecnología NGS es esencial para una amplia gama de aplicaciones, desde la secuenciación del genoma completo hasta estudios más específicos como la secuenciación del exoma, transcriptómica, epigenómica...


Este artículo te guiará a través de los conceptos básicos, las tecnologías actuales, las aplicaciones y los retos de NGS, con un enfoque práctico basado en nuestra propia experiencia.


Principales Tecnologías de Secuenciación NGS


Secuenciación por Síntesis (Illumina)


La secuenciación por síntesis es el método más comúnmente utilizado en NGS, dominado por las plataformas de Illumina. Esta tecnología utiliza un proceso llamado "secuenciación por síntesis", donde nucleótidos fluorescentes se incorporan a una cadena de ADN en crecimiento y se detectan mediante una cámara que captura cada paso del proceso.


¿Qué es una secuenciación por síntesis?

Flujo de trabajo:


En primer lugar, el ADN de la muestra se fragmenta y se le añaden adaptadores específicos que cumplen tres funciones clave:


  1. Fijación: Permiten que los fragmentos de ADN se adhieran a la superficie de la celda de flujo durante la secuenciación.

  2. Amplificación: Facilitan la amplificación local de cada fragmento de ADN en la celda, creando grupos de fragmentos idénticos (clusters).

  3. Secuenciación: Contienen secuencias que sirven de sitio para los primers de secuenciación. Cada ciclo de síntesis añade un nucleótido a la cadena en crecimiento, emitiendo una señal fluorescente que se registra.


Ventajas:


Una alta precisión, escalabilidad, y la capacidad de generar una gran cantidad de datos.


Illumina es la opción preferida para proyectos de secuenciación del genoma completo y estudios de variación genética.


Limitaciones:


La principal limitación es la longitud de lectura, que suele ser corta (entre 50 y 300 pares de bases). Esto puede dificultar la resolución de regiones repetitivas o complejas del genoma.


Secuenciación por Ion de Semiconductores (Ion Torrent)


Esta tecnología, desarrollada por Ion Torrent, detecta la liberación de iones de hidrógeno cuando un nucleótido se incorpora en una cadena de ADN. A diferencia de la secuenciación por síntesis, no requiere nucleótidos fluorescentes, lo que hace que el proceso sea más rápido y menos costoso.



¿Como funciona un Secuenciador Thermofisher?

Flujo de trabajo:


Similar a Illumina, pero en lugar de usar señales fluorescentes, esta tecnología mide cambios de pH que ocurren durante la incorporación de nucleótidos.


Ventajas:


Rapidez y bajo costo, adecuado para aplicaciones donde el tiempo es un factor crítico, como en secuenciación clínica.


Limitaciones:


Menor precisión en comparación con Illumina, especialmente en la detección de variaciones genéticas complejas.


Tecnologías de Tercera Generación: PacBio y Oxford Nanopore


Las tecnologías de tercera generación, como Pacific Biosciences (PacBio) y Oxford Nanopore, representan un avance significativo en la secuenciación, permitiendo lecturas mucho más largas y sin la necesidad de amplificación.


PacBio:


Utiliza secuenciación en tiempo real (SMRT), donde una molécula de ADN pasa a través de una polimerasa fijada a una superficie, permitiendo lecturas de longitud ultra larga (hasta 20 kb o más).


¿Qué es un secuanciador PacBio?

Ideal para estudiar variaciones estructurales, regiones repetitivas y para la secuenciación de genomas completos de novo.


Oxford Nanopore:


Esta tecnología permite la secuenciación de moléculas individuales de ADN a medida que pasan a través de un poro de proteína.


¿Cómo se secuencia con Oxford Nanopore?

Es altamente portátil y permite la secuenciación en tiempo real con lecturas de longitud variable.


  • Ventajas: Lecturas largas que permiten resolver regiones complejas del genoma, útil para la secuenciación de genomas completos, estudios de haplotipos y análisis de variaciones estructurales.

  • Limitaciones: Costos elevados, mayor tasa de error en comparación con tecnologías de segunda generación, por ser las soluciones más modernas y avanzadas.


Flujo de Trabajo en NGS


Recolección y Preparación de Muestras


El proceso de NGS comienza con la recolección de muestras biológicas, que pueden incluir ADN, ARN o ambos, dependiendo de los objetivos del estudio. Las muestras pueden provenir de diversas fuentes, como sangre, tejido, células cultivadas, o incluso muestras ambientales.


¿Cómo se extrae el ADN?

  • Importancia de la calidad de la muestra: La integridad del material genético es fundamental para asegurar la calidad de los datos obtenidos. La degradación del ADN o la contaminación pueden afectar los resultados o que el análisis no pueda realizarse.

  • Consideraciones para ARN: En el caso de la secuenciación de ARN (RNA-Seq), es importante seleccionar ARN de alta calidad y eliminar cualquier posible contaminación de ADN genómico.


Preparación de Bibliotecas: Conceptos Clave y Procedimientos


La preparación de bibliotecas es uno de los pasos más críticos en NGS. Una biblioteca es una colección de fragmentos de ADN preparados para la secuenciación, cada uno con adaptadores específicos ligandos en ambos extremos.


  • Fragmentación del ADN: El ADN se fragmenta en trozos pequeños, típicamente de entre 200 y 600 pares de bases, usando métodos enzimáticos o mecánicos. Estos fragmentos son luego purificados y preparados para el siguiente paso.

  • Adición de adaptadores: Los adaptadores son secuencias de ADN sintéticas que se ligan a los extremos de los fragmentos de ADN. Estos adaptadores son esenciales para la unión de los fragmentos a la superficie de la celda de flujo y para la posterior amplificación y secuenciación.

  • Amplificación por PCR: En algunos casos, los fragmentos de ADN se amplifican mediante PCR para aumentar la cantidad de ADN disponible para la secuenciación. Sin embargo, este paso puede introducir sesgos y artefactos, por lo que debe ser manejado con cuidado.


¿Cómo se hacen las librerías de secuenciación?

Multiplexación y Agrupación de Muestras


La multiplexación permite secuenciar múltiples muestras en una sola corrida de secuenciación, lo que optimiza los recursos y reduce los costos. Este proceso utiliza códigos de barras específicos (también conocidos como índices) que se añaden a los fragmentos de ADN durante la preparación de la biblioteca.


  • Códigos de barras y demultiplexación: Cada muestra recibe un código de barras único. Después de la secuenciación, los datos se demultiplexan utilizando estos códigos, lo que permite identificar las secuencias correspondientes a cada muestra.

  • Optimización de la cobertura: La cantidad de muestras que se pueden multiplexar depende de la profundidad de cobertura requerida para cada muestra. Es importante calcular el número óptimo de muestras para asegurar que cada una reciba la cobertura necesaria sin comprometer la calidad de los datos.


Aplicaciones y Beneficios de NGS


Secuenciación del Genoma Completo vs. Secuenciación Dirigida


La NGS se puede utilizar para secuenciar todo el genoma de un organismo o para secuenciar regiones específicas de interés, como exomas o conjuntos específicos de genes.


  • Genoma Completo: Proporciona una visión integral de todo el ADN en un organismo. Es ideal para estudios exploratorios o para caracterizar completamente un nuevo genoma. Sin embargo, es más costoso y genera una gran cantidad de datos que requieren análisis complejos.

  • Secuenciación Dirigida: Se enfoca en regiones específicas, como el exoma (todas las regiones codificantes del genoma) o un conjunto predefinido de genes. Es más económico y se utiliza cuando se tiene un objetivo de estudio específico, como la búsqueda de mutaciones en genes conocidos.


¿Qué es una secuenciación del genoma completo?

Identificación de SNPs y Variantes Estructurales


NGS es una herramienta poderosa para identificar variaciones genéticas, incluidas pequeñas variantes como polimorfismos de un solo nucleótido (SNPs) y variaciones estructurales más grandes, como inserciones, deleciones, y duplicaciones.



  • SNPs: Los SNPs son la forma más común de variación genética y pueden influir en cómo se expresa un gen o en cómo responde un individuo a ciertos medicamentos.

  • Variantes Estructurales: Estas incluyen reordenamientos de grandes segmentos de ADN, que pueden ser difíciles de detectar con tecnologías de lectura corta pero son más fáciles de identificar con las tecnologías de tercera generación debido a sus lecturas largas.


¿Qué es un SNP?

Usos en Investigación y Medicina Personalizada


NGS ha revolucionado la medicina personalizada, permitiendo tratamientos basados en el perfil genético de un individuo. Esto es particularmente importante en oncología, donde las mutaciones en genes específicos pueden guiar la elección de terapias dirigidas.


  • Oncología: NGS se utiliza para identificar mutaciones en tumores que pueden ser tratadas con terapias dirigidas. Además, permite la monitorización de la evolución del cáncer y la resistencia a los tratamientos.

  • Enfermedades Raras: La capacidad de secuenciar genomas completos ha facilitado el descubrimiento de variantes genéticas asociadas con enfermedades raras, proporcionando diagnósticos precisos y nuevas oportunidades para el desarrollo de terapias.


¿Cómo funciona la medicina de precisión?
Personalización de tratamientos según el perfil genético individual. Atacando solo a las áreas afectadas

Retos y Consideraciones Técnicas


Limitaciones de las Tecnologías de Secuenciación


A pesar de los avances, las tecnologías de secuenciación tienen limitaciones que deben tenerse en cuenta al diseñar un experimento.


  • Precisión vs. Lectura Larga: Las tecnologías como Illumina ofrecen alta precisión, pero con lecturas cortas, lo que puede limitar la resolución de regiones genómicas complejas. Las tecnologías de tercera generación ofrecen lecturas más largas pero con una mayor tasa de error.

  • Costos: Aunque los costos de NGS han disminuido, siguen siendo elevados, especialmente para proyectos de gran escala o que requieren tecnología de tercera generación. Es importante equilibrar el presupuesto con los objetivos científicos.


Cobertura de Secuenciación: Importancia y Cálculo


La cobertura de secuenciación se refiere al número de veces que una región particular del genoma ha sido secuenciada. Una cobertura alta es crucial para asegurar que los resultados sean precisos y reproducibles.


  • Cálculo de la cobertura: La cobertura depende de la profundidad requerida para detectar variantes con confianza. Por ejemplo, en la secuenciación del genoma completo, se suele buscar una cobertura de al menos 30x para asegurar la detección de SNPs y pequeñas indels.

  • Consideraciones para la multiplexación: Multiplexar demasiadas muestras puede reducir la cobertura y comprometer la calidad de los datos. Es importante utilizar calculadoras de costo-cobertura para determinar el número óptimo de muestras a incluir en una corrida de secuenciación.


¿Cuál es la profundidad de secuenciación óptima?

Costos y Optimización en Proyectos de Secuenciación


El costo de NGS varía según la tecnología utilizada, la escala del proyecto y la profundidad de secuenciación requerida.


  • Estrategias de reducción de costos: La multiplexación y el uso de secuenciación dirigida pueden reducir significativamente los costos sin sacrificar la calidad de los datos. También es útil considerar colaboraciones con otras instituciones para compartir los gastos de grandes proyectos de secuenciación.


Análisis Bioinformático de Datos NGS


Alineación y Ensamblaje de Lecturas


Después de la secuenciación, las lecturas crudas deben ser alineadas contra un genoma de referencia o ensambladas de nuevo si no se dispone de un genoma de referencia.


  • Alineación: Involucra mapear cada lectura de ADN a la ubicación correspondiente en un genoma de referencia. Herramientas de software como BWA y Bowtie son comúnmente utilizadas para este propósito.

  • Ensamblaje de novo: En situaciones donde no existe un genoma de referencia, las lecturas se ensamblan para construir un nuevo genoma. Esto es más complejo y requiere herramientas especializadas como SPAdes o Velvet.


Interpretación de Resultados: Herramientas y Software


El análisis bioinformático es una parte crítica del flujo de trabajo de NGS. Existen numerosas herramientas disponibles, cada una adaptada a diferentes tipos de análisis.


  • Análisis de variantes: Una vez alineadas las lecturas, se identifican variantes utilizando software como GATK o FreeBayes. Estas herramientas permiten detectar SNPs, indels y otras variaciones genéticas.

  • Análisis transcriptómico: Para RNA-Seq, herramientas como Cufflinks (la web no esta actualizada) y DESeq se utilizan para cuantificar la expresión génica y detectar cambios en la expresión entre condiciones experimentales.

  • Visualización: Herramientas como IGV (Integrative Genomics Viewer) permiten visualizar las alineaciones de secuencias y explorar los datos a nivel de nucleótidos.


Qué es un nanoporo

Demultiplexación y Organización de Datos


La demultiplexación es el proceso de separar las lecturas por muestra utilizando los códigos de barras asignados durante la preparación de la biblioteca.


  • Demultiplexación: Software como bcl2fastq de Illumina permite convertir archivos brutos en archivos fastq individuales para cada muestra. Este es un paso muy importante para asegurar que los datos de cada muestra se analicen correctamente.

  • Organización y almacenamiento de datos: Dado el gran volumen de datos generado por NGS, es esencial tener un plan de almacenamiento y manejo de datos eficiente. Las plataformas de almacenamiento en la nube, como AWS (Es el sistema que utilizamos en Duponte) o Google Cloud, son opciones habituales para la gestión de datos NGS.

Competidores en servicios en la nube

Futuro de la Secuenciación NGS


Innovaciones en la Tecnología de Secuenciación


El campo de NGS está en constante evolución, con innovaciones que prometen mejorar la precisión, reducir costos y aumentar la accesibilidad.


  • Secuenciación en tiempo real: Tecnologías como Oxford Nanopore ya permiten la secuenciación en tiempo real, lo que podría tener aplicaciones críticas en situaciones de emergencia médica o en entornos de campo.

  • Portabilidad: La miniaturización de dispositivos, como el MinION de Oxford Nanopore, permite llevar la secuenciación a lugares remotos o a laboratorios con recursos limitados, democratizando el acceso a la tecnología.


Impacto en la Investigación y Aplicaciones Clínicas


A medida que la tecnología NGS se perfecciona, su impacto en la investigación biomédica y la medicina clínica seguirá creciendo.


  • Diagnóstico genético: NGS está permitiendo diagnósticos más precisos y rápidos de enfermedades genéticas, incluyendo aquellas que no se podrían identificar con métodos tradicionales.

  • Medicina personalizada: El futuro de la medicina personalizada depende en gran medida de la capacidad de NGS para proporcionar información genética detallada que guíe la toma de decisiones terapéuticas.


Lectura del genoma

A medida que la tecnología avanza, la promesa de NGS se vuelve más concreta, pero también plantea preguntas importantes. ¿Cómo impactará realmente en nuestros tratamientos y diagnósticos? Y, ¿Qué desafíos debemos superar para que todos puedan aprovechar estos avances? No esperes a que esta tecnología esté disponible en tu laboratorio: descubre cómo Duponte puede ofrecerte estas ventajas hoy mismo.

12 visualizaciones0 comentarios

Comments


bottom of page