本发明提供一种针对FASTQ数据的多线程快速存储无损压缩方法,应用于DNA序列的压缩,其中,所述方法包括:数据分类步骤:输入原始FASTQ数据,并将所述原始FASTQ数据的短读分成元数据、质量分数和碱基序列三个数据流;数据压缩步骤:针对元数据,利用增量编码方式进行检测并消除元数据的冗余信息;针对质量分数,利用比特级别的PPM预测模型和算术编码进行压缩;针对碱基序列,利用固定阶位的改良型算术编码进行压缩;数据输出步骤:将不同数据流的压缩结果进行归档合并,输出经过压缩后的最终数据。本发明还提供一种针对FASTQ数据的多线程快速存储无损压缩系统。本发明提供的技术方案能提高压缩效率和压缩速度。
声明:
“针对FASTQ数据的多线程快速存储无损压缩方法及其系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)