本发明涉及一种DNA测序质量分数无损压缩方法,采用类run-length编码方法将提取出来的质量分数进行转换:例如,对于某质量分数A连续出现2次以上相同字符的质量分数串,其出现次数记为n,将该质量分数A的连续出现次数n的相反数-n作为该质量分数串的长度值,以便将该质量分数串转换为A(-n),并存储到压缩文件中,从而压缩此类质量分数。本发明提出了一种特别面向质量分数的无损压缩方法,降低了单独出现的质量分数的编码量,打破了经典的run-length的数据结构,即质量分数-长度对,适应性的公开了一种新机制来对长度进行变换,使得它与质量分数的值域不相交,且压缩方面具备高效性能。
声明:
“DNA测序质量分数无损压缩方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)