Real-Time Analysis
NovaSeq X 系列 会在仪器的计算引擎 (CE) 上运行 RTA4,这是 Real-Time Analysis 软件的一种实现方式。RTA4 会从相机接收的图像中提取强度,执行碱基检出,为碱基检出分配质量分数,比对 PhiX,并在 InterOp 文件中报告数据,供您在 NovaSeq X 系列控制软件 中查看。
为优化处理时间,RTA4 会将信息存储在内存中。RTA4 一旦被终止,处理过程便无法恢复,并且正在处理的运行数据在内存中也将丢失。
每个颜色通道的图像在内存中均以小区的形式传递给 RTA4。RTA4 根据这些图像输出一组带有质量分值的碱基检出文件和过滤文件。其他所有输出均支持输出文件。
|
文件类型 |
描述 |
|---|---|
|
碱基检出文件 |
所分析的每个小区都包含在一个串联碱基检出(*.cbcl)文件中。来自同一泳道和表面的小区会累积到每个泳道和表面对应的 1 个 *.cbcl 文件中。 |
|
过滤文件 |
每个小区生成一个指定簇是否通过过滤的过滤文件(*.filter)。 |
|
簇位置文件 |
对于小区中的每个簇,簇位置(*.locs)文件包含 X 坐标和 Y 坐标。每次运行都会生成簇位置文件。 |
|
InterOp 文件 |
用于 Sequencing Analysis Viewer 的二进制报告文件。InterOp 文件会在整个运行期间加以更新。 |
输出文件用于下游分析。
质量评分会计算每个碱基检出的一组预测因素,然后使用预测因素值在质量表中查找 Q-score。创建质量表的目的是根据特定的测序平台和化学反应版本配置为生成的运行提供最准确的质量预测。
质量评分基于 Phred 算法的修改版本计算。
为了生成 NovaSeq X 系列 的 Q-table,根据这些特定预测功能的簇化确定了三组碱基检出。确定碱基检出组后,根据经验为这三个组中的每个组计算了平均错误率,并在该组相关的预测功能旁边的 Q-table 中记录了对应的 Q-score。因此,采用 RTA4 时只可能得出三个 Q-score,这些 Q-score 表示相应组的平均错误率。总体而言,这可使质量评分得到简化,但准确性却很高。质量表中的三组对应于边际(< Q15)、中等(约 Q20)和高质量(> Q30)碱基检出。各组分别被分配特定的分数,如 9、24 和 40。此外,任何写入 BCL 文件的无检出均被分配为 0 分。将 BCL 文件转换为 FASTQ 格式后,将为无检出分配 2 分。此 Q-score 报告模型可降低存储空间和带宽要求,且不影响准确性或性能。
