Fichiers de sortie de l’analyse secondaire DRAGEN
Cette section fournit des informations sur chaque application DRAGEN, y compris des informations sur les fichiers de sortie. En plus de générer des fichiers spécifiques à chaque application, DRAGEN fournit les indicateurs de l’analyse dans un fichier <sample_name>.metrics.json et les rapports décrits dans la section Rapports d’analyse secondaire NovaSeq X Plus. Pour en savoir plus sur DRAGEN, consultez la section page d’assistance de la plateforme Illumina DRAGEN Bio-IT Platform.
Tous les pipelines DRAGEN prennent en charge la décompression des BCL d’entrée et la compression des fichiers BAM/CRAM de sortie. Les fichiers BAM ne sont pas téléchargés sur la plateforme Illumina DRAGEN Bio-IT Platform si l’option Proactive, Run Monitoring and Storage (Surveillance proactive, exécution et stockage) est sélectionnée.
L’application DRAGEN Methylation prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Conversion FASTQ |
| • | Compression FASTQ aux formats ORA ou Gzip |
| • | Cartographie et alignement (y compris le tri et le marquage des doublons) |
| • | Compression BAM/CRAM (facultatif) |
| • | Génération de mesures et de rapports |
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | Feuille d’échantillons |
Ce flux de travail nécessite un génome de référence spécifique à la méthylation (p. ex. Homo sapiens [1 000 génomes] hg38 Alt Masked v2 Méthylation).
DRAGEN Methylation génère les fichiers de sortie suivants.
|
Composant |
Type |
Nom du fichier de sortie |
||||||
|---|---|---|---|---|---|---|---|---|
|
Cartographie/alignement |
BAM ou CRAM |
|
||||||
|
Génération du rapport
|
GZ |
|
||||||
|
TXT |
|
|||||||
|
Génération de mesures
|
CSV |
|
L’application DRAGEN Somatic prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Conversion FASTQ |
| • | Compression FASTQ aux formats ORA ou Gzip |
| • | Cartographie et alignement (y compris le tri et le marquage des doublons) |
| • | Compression BAM/CRAM (facultatif) |
| • | Définition de variant |
| • | Marquage germinal |
Lorsque le paramètre VariantCallingMode est utilisé, le pipeline prend en charge les algorithmes pour les variants suivants :
| • | None (Aucun) |
| • | Définitions de petits variants |
| • | Toutes les définitions de variants : |
| – | Petit |
| – | Structurel |
| – | Copiez les variants du nombre de copies (pour les génomes humains de référence sur l’instrument) |
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | Feuille d’échantillons |
Les entrées suivantes sont facultatives :
| • | AuxBaselineNoiseFile |
| • | AuxSvBaselineNoiseFile |
| • | AuxCnvPopBAlleleVcfFile |
| • | AuxGermlineTaggingFile |
DRAGEN Somatic génère les fichiers de sortie suivants.
|
Composant |
Type |
Nom du fichier de sortie |
Exigences de sortie |
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Cartographie/alignement |
BAM ou CRAM |
|
S.O. |
|||||||||
|
Définition de petits variants |
VCF et gVCF |
|
|
|||||||||
|
Définition de variants structurels |
VCF |
|
|
|||||||||
|
Variants du nombre de copies |
VCF |
|
|
|||||||||
|
Génération de mesures
|
CSV |
|
S.O. |
L’application DRAGEN Enrichment prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Conversion FASTQ |
| • | Compression FASTQ aux formats ORA ou Gzip |
| • | Cartographie et alignement (y compris le tri et le marquage des doublons) |
| • | Compression BAM/CRAM (facultatif) |
| • | Définition de variant |
Lorsque le paramètre VariantCallingMode est utilisé, le pipeline prend en charge les algorithmes pour les variants suivants :
| • | None (Aucun) |
| • | Définitions de petits variants |
| • | Toutes les définitions de variants : |
| – | Petit |
| – | Structurel |
| – | Copiez les variants du nombre de copies (pour les génomes humains de référence sur l’instrument) |
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | Feuille d’échantillons |
| • | BedFile (si le mode de définition de variant n’est pas égal à aucun) |
| • | GermlineOrSomatic |
Les entrées suivantes sont facultatives :
| • | AuxBaselineNoiseFile |
| • | AuxCnvPanelOfNormalsFile (si le mode de définition de variant est égal à AllVariantCallers) |
DRAGEN prend en charge les options pour améliorer les performances en mode somatique avec l’entrée d’un fichier de référence de bruit. Un fichier Panel of Normals est requis pour CNV.
DRAGEN Enrichment génère les fichiers de sortie suivants.
|
Composant |
Type |
Nom du fichier de sortie |
||||||
|---|---|---|---|---|---|---|---|---|
|
Cartographie/alignement |
BAM ou CRAM |
|
||||||
|
Définition de petits variants |
VCF et gVCF* |
|
||||||
|
Définition de variants structurels |
VCF |
|
||||||
|
Variants du nombre de copies |
VCF |
|
||||||
|
Génération de mesures
|
CSV |
|
* Les fichiers de sortie gVCF ne sont disponibles que pour le mode germinal.
L’application DRAGEN Germline prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Conversion FASTQ |
| • | Compression FASTQ aux formats ORA ou Gzip |
| • | Cartographie et alignement (y compris le tri et le marquage des doublons) |
| • | Compression BAM/CRAM (facultatif) |
| • | Définition de variant |
Le pipeline prend en charge les algorithmes pour les variants suivants :
| • | None (Aucun) |
| • | Définitions de petits variants |
| • | Toutes les définitions de variants : |
| – | Petit |
| – | Structurel |
| – | Copiez les variants du nombre de copies (pour les génomes humains de référence sur l’instrument) |
| – | Répéter l’expansion (pour les génomes humains de référence sur l’instrument) |
| – | Régions d’homozygotie (pour les génomes humains de référence intégrés à l’instrument) |
| – | détection du CYP2D6 |
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | Feuille d’échantillons |
DRAGEN Germline génère les fichiers de sortie suivants.
|
Composant |
Type |
Nom du fichier de sortie |
Exigences de sortie |
||||||
|---|---|---|---|---|---|---|---|---|---|
|
Cartographie/alignement |
BAM ou CRAM |
|
S.O. |
||||||
|
Définition de petits variants |
VCF et gVCF |
|
S.O. |
||||||
|
Définition de variants structurels |
VCF |
|
Généré uniquement pour les lectures par paires |
||||||
|
Variants du nombre de copies |
VCF |
|
Génomes humains uniquement |
||||||
|
Répétition de l’expansion |
VCF |
|
Génomes humains uniquement |
||||||
|
Régions d’homozygotie |
CSV et BED |
|
Génomes humains uniquement |
||||||
|
détection du CYP2D6 |
TSV |
|
Génomes humains uniquement |
||||||
|
Génération de mesures |
CSV |
|
S.O. |
L’application DRAGEN ARN prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Génération des fichiers FASTQ |
| • | Compression FASTQ (ORA ou Gzip) |
| • | Carte/alignement (comprend le tri) |
| • | [Facultatif] Compression BAM/CRAM |
| • | [FullPipeline] Détection de fusion de gènes |
| • | [FullPipeline] Expression du gène du transcriptome entier (quantification des transcriptions) |
L’expression différentielle est également prise en charge de manière facultative.
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | Feuille d’échantillons |
L’entrée suivante est facultative :
| • | RnaGeneAnnotationFile |
Un fichier RnaGeneAnnotationFile est emballé avec chaque génome de référence humain fourni par Illumina. Si un fichier RnaGeneAnnotationFile est fourni par le client lors de la configuration de la série, il est utilisé à la place du fichier emballé avec le génome. Si un fichier RnaGeneAnnotationFile n’est pas disponible avec le génome fourni par Illumina ou directement par le client, les étapes de quantification de fusion de gènes et d’ARN sont ignorées. Si l’expression différentielle est activée, un fichier RnaGeneAnnotationFile doit être fourni.
DRAGEN ARN génère les fichiers de sortie suivants.
|
Composant |
Type |
Nom du fichier de sortie |
Description |
||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Cartographie/alignement |
BAM ou CRAM |
|
Sortie d’alignement conforme aux spécifications de SAM. |
||||||||||||
|
Détection de la fusion de gènes |
Texte clair |
|
|
||||||||||||
|
Quantification des transcriptions |
Texte clair |
|
|
||||||||||||
|
Indicateurs |
JSON, CSV |
|
|
||||||||||||
|
Expression différentielle |
PNG |
Se repoter au tableau suivant des fichiers de sortie des expressions différentielles. |
Pour générer des fichiers de sortie, une comparaison doit être mise en place dans la feuille échantillon. |
Les fichiers suivants sont émis lorsque l’expression différentielle est activée.
|
Nom du fichier |
Description |
|---|---|
|
Control_vs_Comparison.genes.counts.csv |
Décrit le nombre de lectures cartographiées à chaque gène pour chaque échantillon dans les groupes de contrôle et de comparaison. |
|
Control_vs_Comparison.genes.res.csv |
Contient les résultats de DESeq2, qui décrivent l’expression moyenne, le log2 (variations), l’erreur standard du log2 (variations), la valeur p, la valeur p ajustée et le statut d’expression de chaque gène. |
|
Control_vs_Comparison.genes.rlog.csv |
Contient les comptes log-transformés régularisés calculés par DESeq2 |
|
Control_vs_Comparison.differential_expression_metrics.csv |
Contient des mesures d’analyse d’expression différentielle. |
|
Control_vs_Comparison.genes.heatmap.png |
Tracé montrant une carte thermique de l’expression des gènes exprimés de façon différentielle avec des valeurs p ajustées < ‑0,05 pour les échantillons du groupe témoin et du groupe de comparaison. Seuls les 30 premiers gènes exprimés de façon différentielle sont utilisés s’il y a plus de 30 gènes exprimés de façon différentielle. Ce fichier n’est pas disponible lorsque DESeq2 ne converge pas ou lorsqu’il n’y a pas de gènes exprimés de manière différentielle. |
|
Control_vs_Comparison.genes.ma.png |
Variation des ratios d’expression des gènes en fonction de l’intensité moyenne du signal. Le tracé montre les différences entre les mesures prises dans deux échantillons, en transformant les données sur des échelles M (rapport logarithmique) et A (moyenne), puis trace les valeurs. Le graphique MA montre les variations log2 attribuables à une variable donnée par rapport à la moyenne des comptes normalisés pour tous les échantillons. Les points sont colorés en rouge si la valeur p ajustée est inférieure à 0,1. Les points qui sortent du champ sont représentés par des triangles pointant vers le haut ou vers le bas. |
|
Control_vs_Comparison.genes.pca.png |
Le tracé est basé sur les deux premières composantes principales qui expliquent le plus de variance. |
L’application DRAGEN BCL Convert prend en charge les fonctionnalités suivantes :
| • | Décompression des données BCL d’entrée |
| • | Démultiplexage des échantillons |
| • | Manipulation de l’UMI et de l’adaptateur |
| • | Paramètres par échantillon |
| • | Génération de fichiers FASTQ |
| • | Compression des fichiers FASTQ aux formats ORA ou Gzip |
| • | Génération des mesures de QC FASTQ (uniquement pour les 1 024 premiers échantillons) |
Les entrées suivantes sont requises :
| • | Données BCL générées à partir de l’instrument NovaSeq X Plus |
| • | RunInfo.xml |
| • | Feuille d’échantillons |
DRAGEN BCL Convert génère les sorties suivantes.
|
Composant |
Type |
Nom du fichier de sortie |
||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
BclConvert |
FASTQ |
|
Le pipeline DRAGEN BCL Convert utilise les données BCL générées par votre série de séquençage et les informations de la fiche d’échantillon pour produire un fichier FASTQ. Le nom du fichier FASTQ est <Sample_ID>_Sm_L00n_Rp_001.fastq.gz.
Tous les pipelines DRAGEN génèrent les fichiers de démultiplexage suivants par défaut. Les fichiers agrégés sont stockés dans le dossier Demux.
|
Composant |
Type |
Nom du fichier de sortie |
|||
|---|---|---|---|---|---|
|
Démultiplexage |
CSV |
|
|||
|
Principaux codes-barres inconnus |
CSV |
|
|||
|
Saut d’index |
CSV |
|
Pour tous les pipelines, DRAGEN FastQC génère des tracés QC par défaut. Les résultats QC agrégés sont stockés dans le dossier AggregatedReports.
Les mesures ne sont générées que si le nombre d’échantillons est inférieur ou égal à 1 024.
