Pliki wyjściowe analizy wtórnej DRAGEN
W tej części podano informacje o każdej aplikacji DRAGEN, w tym informacje na temat plików wyjściowych. Oprócz generowania plików specyficznych dla poszczególnych aplikacji DRAGEN zapewnia parametry z analizy w pliku <sample_name>.metrics.json oraz raporty opisane w części Raporty z analizy wtórnej NovaSeq X Plus. Więcej informacji o aplikacji DRAGEN można znaleźć na stronie pomocy technicznej platformy Illumina DRAGEN Bio-IT Platform.
Wszystkie procedury DRAGEN obsługują dekompresję wejściowych plików BCL oraz kompresję wyjściowych plików BAM/CRAM. Pliki BAM nie zostaną przesłane do platformy Illumina DRAGEN Bio-IT Platform, jeśli wybrana jest opcja Proactive, Run Monitoring and Storage (Prokatywne, monitorowanie przebiegu i przechowywanie).

Aplikacja DRAGEN Methylation obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Konwersja FASTQ |
• | Kompresja FASTQ do formatu ORA lub Gzip |
• | Mapowanie/dopasowanie (w tym sortowanie i oznaczanie duplikatów) |
• | Kompresja BAM/CRAM (opcjonalna) |
• | Generowanie metryki i raportu |
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | Arkusz próbek |
Ta procedura wymaga genomu referencyjnego specyficznego dla metylacji [np. Homo sapiens (1000 genomów) hg38 Alt Masked v2 Methylation).
DRAGEN Methylation generuje opisane poniżej pliki wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
||||||
---|---|---|---|---|---|---|---|---|
Mapowanie/Dopasowanie |
BAM lub CRAM |
|
||||||
Generowanie raportu
|
GZ |
|
||||||
TXT |
|
|||||||
Generowanie metryki
|
CSV |
|

Aplikacja DRAGEN Somatic obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Konwersja FASTQ |
• | Kompresja FASTQ do formatu ORA lub Gzip |
• | Mapowanie/dopasowanie (w tym sortowanie i oznaczanie duplikatów) |
• | Kompresja BAM/CRAM (opcjonalna) |
• | Rozpoznawanie wariantów |
• | Oznaczanie linii zarodkowej |
Gdy używany jest parametr VariantCallingMode, procedura obsługuje algorytmy dla następujących wariantów rozpoznawania:
• | Brak |
• | Algorytmy rozpoznawanie wariantów małych |
• | Wszystkie algorytmy rozpoznawanie wariantów: |
– | Małych |
– | Strukturalnych |
– | Polimorfizmu liczby kopii (dla ludzkich genomów referencyjnych w aparacie) |
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | Arkusz próbek |
Następujące dane wejściowe są opcjonalne:
• | AuxBaselineNoiseFile |
• | AuxSvBaselineNoiseFile |
• | AuxCnvPopBAlleleVcfPlik |
• | AuxGermlineTaggingFile |
DRAGEN Somatic generuje opisane poniżej pliki wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
Wymagania dotyczące danych wyjściowych |
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Mapowanie/Dopasowanie |
BAM lub CRAM |
|
Nd. |
|||||||||
Rozpoznawanie wariantów małych |
VCF i gVCF |
|
|
|||||||||
Rozpoznawanie wariantów strukturalnych |
VCF |
|
|
|||||||||
Polimorfizm liczby kopii |
VCF |
|
|
|||||||||
Generowanie metryki
|
CSV |
|
Nie dot. |

Aplikacja DRAGEN Enrichment obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Konwersja FASTQ |
• | Kompresja FASTQ do formatu ORA lub Gzip |
• | Mapowanie/dopasowanie (w tym sortowanie i oznaczanie duplikatów) |
• | Kompresja BAM/CRAM (opcjonalna) |
• | Rozpoznawanie wariantów |
Gdy używany jest parametr VariantCallingMode, procedura obsługuje algorytmy dla następujących wariantów rozpoznawania:
• | Brak |
• | Algorytmy rozpoznawanie wariantów małych |
• | Wszystkie algorytmy rozpoznawanie wariantów: |
– | Małych |
– | Strukturalnych |
– | Polimorfizmu liczby kopii (dla ludzkich genomów referencyjnych w aparacie) |
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | Arkusz próbek |
• | BedFile (jeśli tryb rozpoznawania wariantów nie jest równy wartości brak) |
• | GermlineOrSomatic |
Następujące dane wejściowe są opcjonalne:
• | AuxBaselineNoiseFile |
• | AuxCnvPanelOfNormalsFile (jeśli tryb rozpoznawania wariantów jest równy wartości AllVariantCallers) |
DRAGEN obsługuje opcje poprawy wydajności w trybie somatycznym poprzez wprowadzenie pliku szumu bazowego. Plik Panel of Normals (Panel wartości normalnych) jest wymagany dla CNV.
DRAGEN Enrichment generuje opisane poniżej pliki wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
||||||
---|---|---|---|---|---|---|---|---|
Mapowanie/Dopasowanie |
BAM lub CRAM |
|
||||||
Rozpoznawanie wariantów małych |
VCF i gVCF* |
|
||||||
Rozpoznawanie wariantów strukturalnych |
VCF |
|
||||||
Polimorfizm liczby kopii |
VCF |
|
||||||
Generowanie metryki
|
CSV |
|
* Pliki wyjściowe gVCF są dostępne wyłącznie dla trybu linii zarodkowej.

Aplikacja DRAGEN Germline obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Konwersja FASTQ |
• | Kompresja FASTQ do formatu ORA lub Gzip |
• | Mapowanie/dopasowanie (w tym sortowanie i oznaczanie duplikatów) |
• | Kompresja BAM/CRAM (opcjonalna) |
• | Rozpoznawanie wariantów |
Procedura obsługuje algorytmy dla następujących wariantów rozpoznawania:
• | Brak |
• | Algorytmy rozpoznawanie wariantów małych |
• | Wszystkie algorytmy rozpoznawanie wariantów: |
– | Małych |
– | Strukturalnych |
– | Polimorfizmu liczby kopii (dla ludzkich genomów referencyjnych w aparacie) |
– | Ekspansja powtórzeń (dla ludzkich genomów referencyjnych w aparacie) |
– | Regiony homozygotyczności (dla ludzkich genomów referencyjnych w aparacie) |
– | Wykrywanie CYP2D6 |
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | Arkusz próbek |
DRAGEN Germline generuje poniżej opisane pliki wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
Wymagania dotyczące danych wyjściowych |
||||||
---|---|---|---|---|---|---|---|---|---|
Mapowanie/Dopasowanie |
BAM lub CRAM |
|
Nd. |
||||||
Rozpoznawanie wariantów małych |
VCF i gVCF |
|
Nd. |
||||||
Algorytm rozpoznawania wariantów strukturalnych |
VCF |
|
Generowane tylko dla odczytu ze sparowanym końcem |
||||||
Polimorfizm liczby kopii |
VCF |
|
Tylko genomy ludzkie |
||||||
Ekspansja powtórzeń |
VCF |
|
Tylko genomy ludzkie |
||||||
Regiony homozygotyczności |
CSV i BED |
|
Tylko genomy ludzkie |
||||||
Wykrywanie CYP2D6 |
TSV |
|
Tylko genomy ludzkie |
||||||
Generowanie metryki |
CSV |
|
Nie dot. |

Aplikacja DRAGEN RNA obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Generowanie pliku FASTQ |
• | Kompresja FASTQ (ORA lub Gzip) |
• | Mapa/dopasowanie (w tym sortowanie) |
• | [Opcjonalnie] Kompresja BAM/CRAM |
• | [FullPipeline] Wykrywanie fuzji genów |
• | [FullPipeline] Ekspresja genu całego transkryptomu (kwantyfikacja transkryptów) |
Wyrażenie różnicowe jest również opcjonalnie obsługiwane.
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | Arkusz próbek |
Następujące dane wejściowe są opcjonalne:
• | RnaGeneAnnotationFile |
RnaGeneAnnotationFile jest pakowany z każdym dostarczonym przez firmę Illumina ludzkim genomem referencyjnym. Jeśli RnaGeneAnnotationFile jest dostarczany przez klienta przy konfiguracji przebiegu, jest on używany zamiast pliku zapakowanego z genomem. Jeśli RnaGeneAnnotationFile nie jest dostępny w genomie dostarczonym przez firmę Illumina lub bezpośrednio przez klienta, wówczas kroki analizy ilościowej Gene Fusion i kwantyfikacji RNA zostają pominięte. Jeśli włączona jest funkcja Differential Expression (Wyrażenie różnicowe), należy dostarczyć RnaGeneAnnotationFile.
DRAGEN RNA generuje opisane poniżej pliki wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
Opis |
||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Mapowanie/Dopasowanie |
BAM lub CRAM |
|
Dane wyjściowe dopasowania zgodne ze specyfikacjami SAM. |
||||||||||||
Wykrywanie fuzji genów |
Zwykły tekst |
|
|
||||||||||||
Kwantyfikacja transkryptów |
Zwykły tekst |
|
|
||||||||||||
Metryki |
JSON, CSV |
|
|
||||||||||||
Ekspresja różnicowa |
PNG |
Należy zapoznać się z poniższą tabelą plików wyjściowych ekspresji różnicowej. |
W celu wygenerowania plików wyjściowych należy skonfigurować porównanie w arkuszu próbek. |
Gdy włączona jest funkcja ekspresji różnicowej, generowane są poniżej opisane pliki wyjściowe.
Nazwa pliku |
Opis |
---|---|
Control_vs_Comparison.genes.counts.csv |
Zawiera opis liczby odczytów mapowanych na poszczególne geny dla każdej próbki w grupie kontrolnej i porównawczej. |
Control_vs_Comparison.genes.res.csv |
Zawiera wyniki analizy DESeq2, które opisują ekspresję średnią, log2 (wielokrotność zmian), błąd standardowy log2, wartość P, skorygowaną wartość P oraz status ekspresji każdego genu. |
Control_vs_Comparison.genes.rlog.csv |
Zawiera wyniki regularyzowanych zliczeń po transformacji logarytmicznej obliczone w ramach analizy DESeq2 |
Control_vs_Comparison.differential_expression_metrics.csv |
Zawiera wyniki analizy ekspresji różnicowej. |
Control_vs_Comparison.genes.heatmap.png |
Wykres przedstawiający mapę cieplną ekspresji genów podlegających ekspresji różnicowej z dostosowanymi wartościami P < -0,05 dla próbek w grupach kontrolnych i porównawczych. Tylko 30 najlepszych genów podlegających ekspresji różnicowej jest zastosowanych, jeśli jest więcej niż 30 genów podlegających ekspresji różnicowej. Ten plik nie jest dostępny, gdy DESeq2 nie zbiega się lub gdy nie ma genów podlegających ekspresji różnicowej. |
Control_vs_Comparison.genes.ma.png |
Różne wartości stosunku ekspresji genów wyrażone jako funkcja średniej intensywności sygnału. Wykres przedstawia różnice między pomiarami wykonanymi w dwóch próbkach, przekształcając dane na skalę M (współczynnik logarytmiczny) i A (średnia arytmetyczna), a następnie wykreślając te wartości. Wykres MA przedstawia zmiany log2-krotności przypisane do danej zmiennej w średniej znormalizowanych zliczeń dla wszystkich próbek. Punkty mają kolor czerwony, jeśli skorygowana wartość p jest mniejsza niż 0,1. Punkty poza zakresem tego okna są widoczne na wykresie jako trójkąty otwarte wskazujące w górę lub dół. |
Control_vs_Comparison.genes.pca.png |
Wykres bazujący na pierwszych dwóch elementach głównych, które odpowiadają za większość zmienności. |

Aplikacja DRAGEN BCL Convert obsługuje następujące funkcje:
• | Dekompresja danych wejściowych BCL |
• | Demultipleksowanie próbki |
• | Obsługa UMI i adaptera |
• | Ustawienia na próbkę |
• | Generowanie plików FASTQ |
• | Kompresja plików FASTQ do formatu ORA lub Gzip |
• | Generowanie wskaźników kontroli jakości FASTQ (tylko dla pierwszych 1024 próbek) |
Wymagane są następujące dane wejściowe:
• | Dane BCL wygenerowane z aparatu NovaSeq X Plus |
• | RunInfo.xml |
• | Arkusz próbek |
DRAGEN BCL Convert generuje następujące dane wyjściowe.
Element |
Typ |
Nazwa pliku wyjściowego |
||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
BclConvert |
FASTQ |
|
Procedura DRAGEN BCL Convert wykorzystuje dane BCL wygenerowane z sekwencjonowania oraz informacje z arkusza próbek w celu wygenerowania pliku FASTQ. Nazwa pliku FASTQ to <Sample_ID>_Sm_L00n_Rp_001.fastq.gz.

Wszystkie procedury DRAGEN domyślnie generują następujące pliki demultipleksowania. Zagregowane pliki są przechowywane w folderze Demux.
Element |
Typ |
Nazwa pliku wyjściowego |
|||
---|---|---|---|---|---|
Demultipleksowanie |
CSV |
|
|||
Pierwsze nieznane kody kreskowe |
CSV |
|
|||
Błędy multipleksowania |
CSV |
|

W przypadku wszystkich procedur DRAGEN FastQC domyślnie generuje wykresy kontroli jakości. Zagregowane wyniki kontroli jakości są zapisywane w folderze AggregatedReports.
Metryki są generowane tylko wtedy, gdy liczba próbek jest mniejsza lub równa 1024.