Outputfiler til den sekundære DRAGEN-analyse
Dette afsnit indeholder oplysninger om hvert enkelt DRAGEN-program, herunder oplysninger om outputfiler. Ud over at generere filer, der er specifikke for hvert program, angiver DRAGEN målinger fra analysen i en <sample_name>.metrics.json-fil og de rapporter, der er beskrevet i NovaSeq X Plus sekundære analyserapporter. Du kan finde yderligere oplysninger om DRAGEN på Illumina Supportside til DRAGEN Bio-IT Platform.
Alle DRAGEN-pipelines understøtter dekomprimering af BCL-inputfiler og komprimering af BAM/CRAM-outputfiler. BAM-filer vil ikke blive uploadet til Illumina DRAGEN Bio-IT Platform, hvis Proactive, Run Monitoring (Proaktiv, Kør overvågning) og Storage (Lager) er valgt.
DRAGEN-methyleringsprogrammet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | FASTQ-konvertering |
| • | FASTQ-komprimering til ORA- eller Gzip-formater |
| • | Kortlægning/tilpasning (omfatter sortering og markering af duplikater) |
| • | BAM/CRAM-komprimering (valgfrit) |
| • | Målinger og rapportgenerering |
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | Prøveark |
Denne arbejdsgang kræver et methyleringsspecifikt referencegenom (f.eks. Homo sapiens [1000 genomer] hg38 Alt Masked v2-methylering).
DRAGEN-methylering genererer følgende outputfiler.
|
Komponent |
Type |
Outputfilens navn |
||||||
|---|---|---|---|---|---|---|---|---|
|
Kortlægning/tilpasning |
BAM eller CRAM |
|
||||||
|
Rapportgenerering
|
GZ |
|
||||||
|
TXT |
|
|||||||
|
Generering af målinger
|
CSV |
|
DRAGEN Somatisk-programmet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | FASTQ-konvertering |
| • | FASTQ-komprimering til ORA- eller Gzip-formater |
| • | Kortlægning/tilpasning (omfatter sortering og markering af duplikater) |
| • | BAM/CRAM-komprimering (valgfrit) |
| • | Variantbestemmelse |
| • | Tagging af kimcellelinje |
Når parameteren VariantCallingMode anvendes, understøtter pipelinen algoritmer for følgende variantbestemmelsesprogrammer:
| • | Ingen |
| • | Variantbestemmelsesprogram for mindre varianter |
| • | Variantbestemmelsesprogram for alle varianter: |
| – | Mindre |
| – | Strukturel |
| – | Kopiér nummervarianter (for humane referencegenomer på instrumentet) |
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | Prøveark |
Følgende input er valgfrie:
| • | AuxBaselineNoiseFile |
| • | AuxSvBaselineNoiseFile |
| • | AuxCnvPopBAlleleVcfFile |
| • | AuxGermlineTaggingFile |
DRAGEN Somatisk genererer følgende outputfiler.
|
Komponent |
Type |
Outputfilens navn |
Krav til output |
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Kortlægning/tilpasning |
BAM eller CRAM |
|
Ikke relevant |
|||||||||
|
Bestemmelse af små varianter |
VCF og gVCF |
|
|
|||||||||
|
Bestemmelse af strukturelle varianter |
VCF |
|
|
|||||||||
|
Kopiér nummervarianter |
VCF |
|
|
|||||||||
|
Generering af målinger
|
CSV |
|
Ikke relevant |
DRAGEN Enrichment-programmet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | FASTQ-konvertering |
| • | FASTQ-komprimering til ORA- eller Gzip-formater |
| • | Kortlægning/tilpasning (omfatter sortering og markering af duplikater) |
| • | BAM/CRAM-komprimering (valgfrit) |
| • | Variantbestemmelse |
Når parameteren VariantCallingMode anvendes, understøtter pipelinen algoritmer for følgende variantbestemmelsesprogrammer:
| • | Ingen |
| • | Variantbestemmelsesprogram for mindre varianter |
| • | Variantbestemmelsesprogram for alle varianter: |
| – | Mindre |
| – | Strukturel |
| – | Kopiér nummervarianter (for humane referencegenomer på instrumentet) |
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | Prøveark |
| • | BedFile (hvis Variant Calling Mode (Variantbestemmelsestilstand) ikke er lig med ingen) |
| • | GermlineOrSomatic |
Følgende input er valgfrie:
| • | AuxBaselineNoiseFile |
| • | AuxCnvPanelOfNormalsFile (hvis Variant Calling Mode (Variantbestemmelsestilstand) er lig med AllVariantCallers (AlleVariantbestemmelser)) |
DRAGEN understøtter muligheder for at forbedre ydeevnen i somatisk tilstand med input fra en baselinefil indeholdende støj. Der kræves en fil med et panel af normaler til CNV.
DRAGEN Enrichment genererer følgende outputfiler.
|
Komponent |
Type |
Outputfilens navn |
||||||
|---|---|---|---|---|---|---|---|---|
|
Kortlægning/tilpasning |
BAM eller CRAM |
|
||||||
|
Bestemmelse af små varianter |
VCF og gVCF* |
|
||||||
|
Bestemmelse af strukturelle varianter |
VCF |
|
||||||
|
Kopiér nummervarianter |
VCF |
|
||||||
|
Generering af målinger
|
CSV |
|
* gVCF-outputfiler er kun tilgængelige for kimcellelinje-tilstand.
DRAGEN Germline-programmet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | FASTQ-konvertering |
| • | FASTQ-komprimering til ORA- eller Gzip-formater |
| • | Kortlægning/tilpasning (omfatter sortering og markering af duplikater) |
| • | BAM/CRAM-komprimering (valgfrit) |
| • | Variantbestemmelse |
Pipelinen understøtter algoritmer for følgende variantbestemmelsesprogrammer:
| • | Ingen |
| • | Variantbestemmelsesprogram for mindre varianter |
| • | Variantbestemmelsesprogram for alle varianter: |
| – | Mindre |
| – | Strukturel |
| – | Kopiér nummervarianter (for humane referencegenomer på instrumentet) |
| – | Repeat-ekspansion (for humane referencegenomer på instrumentet) |
| – | Homozygositetsområder (for humane referencegenomer på instrumentet) |
| – | CYP2D6-detektion |
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | Prøveark |
DRAGEN Germline genererer følgende outputfiler.
|
Komponent |
Type |
Outputfilens navn |
Krav til output |
||||||
|---|---|---|---|---|---|---|---|---|---|
|
Kortlægning/tilpasning |
BAM eller CRAM |
|
Ikke relevant |
||||||
|
Bestemmelse af små varianter |
VCF og gVCF |
|
Ikke relevant |
||||||
|
Bestemmelse af strukturelle varianter |
VCF |
|
Genereres kun for paired-end-aflæsninger |
||||||
|
Kopiér nummervarianter |
VCF |
|
Kun humane genomer |
||||||
|
Repeat-ekspansion |
VCF |
|
Kun humane genomer |
||||||
|
Homozygositetsområder |
CSV og BED |
|
Kun humane genomer |
||||||
|
CYP2D6-detektion |
TSV |
|
Kun humane genomer |
||||||
|
Generering af målinger |
CSV |
|
Ikke relevant |
DRAGEN RNA-programmet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | FASTQ-generering |
| • | FASTQ-komprimering (ORA eller Gzip) |
| • | Kortlægning/tilpasning (omfatter sortering) |
| • | [Valgfri] BAM/CRAM-komprimering |
| • | [FullPipeline] Detektion af genfusioner |
| • | [FullPipeline] Fuld transskriptom-genekspression (kvantificering af transskripter) |
Differentieret ekspression understøttes også valgfrit.
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | Prøveark |
Følgende input er valgfrit:
| • | RnaGeneAnnotationFile |
En RnaGeneAnnotationFile er pakket sammen med hver af disse Illumina-leverede, humane referencegenomer. Hvis en RnaGeneAnnotationFile leveres af kunden under kørselsopsætningen, bruges den i stedet for den fil, der er pakket med genomet. Hvis en RnaGeneAnnotationFilel ikke er tilgængelig med det Illumina-leverede genom eller direkte fra kunden, springes Gene Fusion og RNA-kvantificeringstrin over. Hvis Differentialeudtryk er aktiveret, skal der angives en RnaGeneAnnotationFile.
DRAGEN RNA genererer følgende outputfiler.
|
Komponent |
Type |
Outputfilens navn |
Beskrivelse |
||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Kortlægning/tilpasning |
BAM eller CRAM |
|
Tilpasningsoutput, der opfylder SAM-specifikationerne. |
||||||||||||
|
Detektion af genfusioner |
Almindelig tekst |
|
|
||||||||||||
|
Kvantificering af transskripter |
Almindelig tekst |
|
|
||||||||||||
|
Målinger |
JSON, CSV |
|
|
||||||||||||
|
Differentieret ekspression |
PNG |
Se følgende tabel over outputfiler for differentieret ekspression. |
For at generere outputfiler skal der konfigureres en sammenligning i prøvearket. |
Der bliver genereret følgende filer, når differentieret ekspression er aktiveret.
|
Filnavn |
Beskrivelse |
|---|---|
|
Control_vs_Comparison.genes.counts.csv |
Beskriver antallet af aflæsninger, der er knyttet til hvert gen for hver prøve i kontrol- og sammenligningsgrupperne. |
|
Control_vs_Comparison.genes.res.csv |
Indeholder DESeq2-resultater, som beskriver den gennemsnitlige ekspression, log2 (foldændring), standardfejl af log2 (foldændring), p-værdi, justeret p-værdi og ekspressionsstatus for hvert gen. |
|
Control_vs_Comparison.genes.rlog.csv |
Indeholder normaliserede log-transformerede tællinger, der er beregnet af DESeq2 |
|
Control_vs_Comparison.differential_expression_metrics.csv |
Indeholder analysemålinger for differentieret ekspression. |
|
Control_vs_Comparison.genes.heatmap.png |
Plot, der viser et varmekort over ekspressionen af de differentielt udtrykte gener med justerede p-værdier < -0,05 for prøver i kontrol- og sammenligningsgrupperne. Kun de 30 mest differentielt udtrykte gener anvendes, hvis der er mere end 30 differentielt udtrykte gener. Denne fil er ikke tilgængelig, når DESeq2 ikke konvergerer, eller når der ikke er nogen differentielt udtrykte gener. |
|
Control_vs_Comparison.genes.ma.png |
Variation af genekspressionsforhold som en funktion af gennemsnitlig signalintensitet. Plottet viser forskellene mellem målinger taget i to prøver ved at omdanne dataene til M-skalaer (logforhold) og A-skalaer (gennemsnit) og derefter plotte disse værdier. MA-plottet viser de log2-foldændringer, der kan tilskrives en given variabel over gennemsnittet af normaliserede tællinger for alle prøverne. Hvis den justerede p‑værdi er under 0,1, er punkterne røde. Punkter, der falder uden for vinduet, plottes som åbne trekanter, der enten peger op eller ned. |
|
Control_vs_Comparison.genes.pca.png |
Diagram baseret på de første to hovedkomponenter, som forklarer den største varians. |
DRAGEN BCL Convert-programmet understøtter følgende funktioner:
| • | Dekompression af input-BCL-data |
| • | Demultipleksering af prøver |
| • | Håndtering af UMI og adapter |
| • | Indstillinger pr. prøve |
| • | Generering af FASTQ-filer |
| • | Komprimering af FASTQ-filer til ORA- eller Gzip-formater |
| • | Generering af FASTQ-kvalitetskontrolmålinger (kun for de første 1.024 prøver) |
Følgende input er påkrævet:
| • | BCL-data genereret fra NovaSeq X Plus-instrumentet |
| • | RunInfo.xml |
| • | Prøveark |
DRAGEN BCL Convert genererer følgende output.
|
Komponent |
Type |
Outputfilens navn |
||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
BclConvert |
FASTQ |
|
DRAGEN BCL Convert-pipeline genererer en FASTQ-outputfil på baggrund af de BCL-data, der bliver genereret i forbindelse med sekventeringskørslen, og oplysningerne på prøvearket. FASTQ-filnavnet er <Sample_ID>_Sm_L00n_Rp_001.fastq.gz.
Alle DRAGEN-pipelines genererer som standard følgende demultipleksering af filer. Aggregerede filer gemmes i Demux-mappen.
|
Komponent |
Type |
Outputfilens navn |
|||
|---|---|---|---|---|---|
|
Demultipleksering |
CSV |
|
|||
|
Rangliste over ukendte stregkoder |
CSV |
|
|||
|
Ukorrekt indekstildeling |
CSV |
|
DRAGEN FastQC genererer som standard QC-diagrammer for alle pipelines. Aggregerede QC-resultater gemmes i AggregatedReports-mappen.
Målinger genereres kun, hvis antallet af prøver er mindre end eller lig med 1.024.
