Real-Time Analysis
Serija NovaSeq X Obrade RTA4, implementacija softvera Real-Time Analysis, na instrumentu Compute Engine (CE). RTA4 izdvaja intenzitete iz slika primljenih od fotoaparata, izvodi određivanje baza, dodjeljuje ocjenu kvalitete za otkrivanje baza, usklađuje se s PhiX-om i izvješćuje podatke u InterOp datotekama za prikaz u NovaSeq X Series Control Software.
Kako biste optimizirali vrijeme obrade, podatke RTA4 pohranjujete u memoriju. Ako se RTA4 prekine, obrada se ne nastavlja i svi podaci obrade koji se obrađuju u memoriji se gube.
Slike iz svakog kanala prosljeđuju se u memoriju RTA4 kao kvadratići. Na temelju tih slika RTA4 daje skup datoteka osnovnog očitavanja s ocjenom kvalitete i datoteka filtra. Svi drugi izlazi podrška su izlaznim datotekama.
|
Vrsta datoteke |
Opis |
|---|---|
|
Datoteke za otkrivanje baza |
Svaka pločica koja se analizira uključena je u datoteku za očitavanje baza (*.cbcl). Pločice iz iste trake i površine agregiraju se u 1 *.cbcl datoteku za svaku stazu i površinu. |
|
Datoteke o filtriranju |
Svaka pločica proizvodi datoteku za filtriranje (*.filter) koja određuje prolazi li klaster filtre. |
|
Datoteke s lokacijom klastera |
Datoteke s lokacijom klastera (*.locs) sadrže koordinate X,Y svakog klastera u kvadratiću. Za svaku obradu generira se datoteka lokacije klastera. |
|
Datoteke o internim operacijama (InterOp) |
Binarne datoteke za izvješćivanje koje se upotrebljavaju za Sequencing Analysis Viewer. Datoteke o internim operacijama ažuriraju se tijekom obrade. |
Izlazne datoteke se upotrebljavaju za nizvodnu analizu.
Ocjena kvalitete (Q-ocjena) predviđanje je vjerojatnosti netočnog očitavanja baze. Veća ocjena kvalitete upućuje na to da je veća kvaliteta otkrivanja baza i veća vjerojatnost da je ona točna. Nakon određivanja ocjene kvalitete rezultati se bilježe u datoteke otkrivanja baza (*.cbcl).
Ocjena kvalitete sažeto komunicira male vjerojatnosti pogreške. Ocjene kvalitete navode se kao Q(X), pri čemu je X ocjena. U sljedećoj tablici prikazan je odnos između ocjene kvalitete i vjerojatnosti pogreške.
|
Ocjena kvalitete Q(X) |
Vjerojatnost pogreške |
|---|---|
|
Q30 |
0,001 (1 na 1000) |
|
Q20 |
0,01 (1 na 100) |
|
Q10 |
0,1 (1 na 10) |
Pri ocjenjivanju kvalitete računa se skup predviđanja za svako očitavanje baze, a zatim se te vrijednosti upotrebljavaju za traženje Q-ocjene u tablici kvalitete. Tablice kvalitete namijenjene su optimalno preciznom predviđanju kvalitete obrada generiranih određenim konfiguracijama platforme za sekvenciranje i verzijama kemijskih postupaka.
Ocjenjivanje kvalitete temelji se na izmijenjenoj verziji Phredovog algoritma.
Za generiranje Q-tablice za Serija NovaSeq X, određene su tri skupine očitavanja baza, na temelju grupiranja tih specifičnih prediktivnih značajki. Nakon grupiranja očitavanja baza srednja stopa pogrešaka izračunata je za svaku od tri skupine, a odgovarajući Q-rezultati zabilježeni su u Q-tablici uz prediktivne značajke koje se povezuju s tom skupinom. Kao takvi, moguće su samo tri rezultata ocjene kvalitete s RTA4 i ti rezultati ocjene kvalitete predstavljaju prosječnu stopu pogreške grupe. Sve u svemu, to rezultira pojednostavljenim, ali vrlo preciznim bodovanjem kvalitete. Tri skupine u tablici kvalitete odgovaraju marginalnim (< Q15), srednjim (~ Q20) i visokokvalitetnim (> Q30) očitavanjima baza. Grupama se dodjeljuju specifični rezultati kao što su 9, 24 i 40. Osim toga, rezultat od 0 dodjeljuje se svim pozivima bez poziva spremljenim u BCL datoteke. Nakon što se BCL datoteke pretvore u format FASTQ, ocjena 2 dodjeljuje se bez poziva. Ovaj rezultat ocjene kvalitete model izvješćivanja smanjuje prostor za pohranu i zahtjeve propusnosti bez utjecaja na točnost ili performanse.
