本发明公开了一种基于纠错的基因组测序数据无损压缩方法及相关设备,所述方法包括:识别并纠正原始测序短片段中的测序碱基错误,并记录碱基错误信息,所述碱基错误信息包括测序错误的碱基位置及原碱基;将原始测序短片段归类到纠正后的索引区域文件中,并将测序错误纠正信息加入到索引区域文件中;对不同的索引区域文件内原始测序短片段中的碱基序列进行排序并进行压缩,得到基因组测序数据的压缩结果文件。本发明实现了高效的测序短片段测序错误的纠正,通过纠正碱基当中的测序错误,使得更多相似测序短片段被分配到同一桶中,进而提高了后续桶内测序短片段的压缩效率,通过记录纠正测序短片段中的桶索引序列,实现对基因组测序数据的无损压缩。
声明:
“基于纠错的基因组测序数据无损压缩方法及相关设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)