本发明公开一种高通量DNA测序质量分数无损压缩系统及压缩方法,所述方法包括:A、预先基于文化基因算法构造质量分数压缩码本;B、接收输入的原始高通量DNA测序质量分数数据,针对数据中每个原始质量分数序列在质量分数压缩码本中搜索与其最相似的编码矢量;C、利用所搜索到的编码矢量对原始质量分数序列进行压缩。本发明通过对质量分数数据进行整体设计得到压缩码本,并借助文化基因算法优化,从而实现最佳压缩编码性能。其整体压缩率显著优于现有方法。另外,本发明的每个寻优个体表示单一编码矢量以及采用多模优化方式有效提升了码本设计效率。同时码本设计与压缩/解压缩过程相分离大大减少了运算时间。
声明:
“高通量DNA测序质量分数无损压缩系统及压缩方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)