Next Generation Sequencing
Die Einführung der Next Generation Sequencing (NGS)-Technologien hat die Etablierung bedeutender, neuer diagnostischer Anwendungen in der täglichen Routine ermöglicht. Neben der extrem hohen Sequenzierkapazität ermöglicht NGS die klonale Sequenzierung einzelner Moleküle, eine höhere diagnostische Sensitivität durch parallele Sequenzierung von ganzen Genpanels, vereinfachte Handhabung sowie die parallele und dadurch kostengünstigere Bearbeitung der Proben. Neueste technische Fortschritte haben NGS zu einer verlässlichen Alternative für die klassische Sanger-Sequenzierung entwickelt.
Die NGS-Methode ist vielfältig einsetzbar: Sowohl Transkriptome (RNA), Epigenome (Methylierung) und Genome (DNA) können analysiert werden. In der molekulargenetischen Diagnostik steht die Methode des „Targeted resequencing“ derzeit im Mittelpunkt. Hierbei wird gezielt nur ein Teil des Genoms, das sogenannte Exom oder auch nur ein Genpanel resequenziert.
Die Zielsequenz muss hierfür angereichert werden. Dieses „Capturing“ kann PCR-basierend, Array-basierend oder „Solution“-basierend erfolgen. Während des „Capturing“ werden an die fragmentierte DNAs die sogenannten Adaptoren angefügt, die für die anschließende Sequenzierung benötigt werden. Diese beinhalten auch die Indices, um die generierten Sequenzen später wieder dem entsprechenden Patienten zuordnen zu können.
In Abhängigkeit von der Fragestellung werden die Zielregionen unter Verwendung eines TWIST Custom Panels (TWIST Bioscience, kleine Genpanels) oder mithilfe der TWIST Human Core Exome Enrichment Technologie (TWIST Bioscience, Exome-Sequenzierung mit Auswertung eines Genpanels) angereichert.
Die so generierten Libaries werden anschließend mittels der Illumina sequencing-by-synthesis (SBS)-Methode sequenziert. Bei dieser Methode wird die fragmentierte Template-DNA über spezifische Adaptoren kovalent an einen Glasobjektträger (FlowCell) gebunden, auf der die Sequenzierreaktion stattfindet. Von dem gebundenen Startmolekül ausgehend werden durch einen PCR-ähnlichen Schritt Cluster aus identischen Molekülen gebildet (Bridge-amplification). Die Sequenzierung erfolgt zyklusweise und nutzt reversible Terminatorchemie und fluoreszenzmarkierte Nukleotide. In jedem Sequenzierzyklus wird genau ein Nukleotid komplementär zu der Template-DNA eingebaut. Anschließend wird die Fluoreszenzgruppe abgespalten, das folgende Lichtsignal detektiert und die Terminatorgruppe entfernt, so dass ein weiteres Nukleotid im folgenden Zyklus eingebaut werden kann. Ein besonderes Merkmal der Illumina SBS-Methode ist die Möglichkeit, eine sogenannte paired-end-Sequenzierung durchzuführen. Hierbei werden die zu sequenzierenden DNA-Fragmente von jeder Seite mit einer vorher festgelegten Leseweite von 100-250 bp sequenziert. Je nach Größe der DNA-Fragmente können diese Reads überlappen oder durch einen nicht-sequenzierten DNA-Teil (Insert) getrennt sein. Die Paired-end-Sequenzierung bietet viele Vorteile bei der bioinformatischen Auswertung und kann die Genauigkeit der Analysen signifikant erhöhen.
Für die Sequenzierung wird abhängig von der Fragestellung ein MiSeq-System (Illumina) (Sequenzierung kleinerer Gen-Panels) oder ein HiSeq-2500 System (Illumina) (Whole-Exome Sequenzierungen) eingesetzt.
Datenanalyse
Die Datenanalyse erfolgt hausintern. Die von der NGS-Plattform erzeugten digitalen Daten stellen die Primärdaten dar, die in eine Nukleotidabfolge übersetzt werden, indem eine Software die auf der Flow cell pro Zyklus detektierten Lichtsignale ermittelt und einem Nukleotid zuordnet. Man bezeichnet dies als Base calling. Ergebnis des Base calling ist der Sequence Read.
Im Rahmen der primären Datenanalyse werden die einzelnen Sequence Reads mit Hilfe von Computerprogrammen ihrer Stelle im humanen Referenzgenom zugeordnet (Alignment). Da der gleiche DNA-Abschnitt aus hunderten oder tausenden Sequenzclustern vorliegt, ist das gleiche Nukleotid in hunderten bis tausenden von Reads vorhanden. Man spricht hier von Sequenziertiefe (Sequencing Depth). Dieses Potential des NGS wird auch als massives paralleles Sequenzieren oder Ultratief-Sequenzieren (Ultradeep sequencing, auch Deep sequencing) bezeichnet und ist insbesondere für den Nachweis von geringen Anteilen veränderter DNA in einer Probe wichtig. Im Rahmen der sekundären Datenanalyse wird ermittelt, an welchen Positionen sich die untersuchte DNA vom Referenzgenom unterscheidet. Bei diesem so genannte Variant calling müssen Sequenzierartefakte herausgefiltert werden, die z.B. anhand der geringen Qualität eines Nukleotidsignals identifiziert werden können. Verschiedene Programme und Algorithmen stehen auch hier zur Verfügung. Nach dieser Qualitätsfilterung bleiben bei der Analyse eines Exoms bis zu 40.000 Varianten übrig, die dann im Hinblick auf ihre Pathogenität, d.h. auf einen Zusammenhang mit Phänotyp des Patienten, überprüft werden müssen. Bei dieser tertiären Datenanalyse werden die Varianten eines Patienten mit unterschiedlichen Datenbanken abgeglichen. Auf diese Weise werden häufige Varianten herausgefiltert. Nach dieser Filterung bleiben nur noch ca. 2% der Varianten übrig. Die weitere Filterung richtet sich nach Fragestellung.
Für die tertiäre Datenanalyse wird abhängig von der Fragestellung das SEQNEXT® Modul der Sequence Pilot Software (JSI medical Systems; https://jsi-mediysy.de) oder die Software NGS Variant Analyzer (Software by Christian Thiel-Hirschmann) eingesetzt.