本发明公开了一种基因测序数据压缩预处理方法、系统及计算机可读介质,方法实施步骤包括获取参考基因组数据,获取短串K‑mer及其预测字符c之间的映射关系,得到包含参考基因组的正链及负链中任意短串K‑mer及其对应相邻位的预测字符c的预测数据模型P1;系统为包含编程以执行前述方法的计算机系统,计算机可读介质包含执行前述方法的计算机程序。本发明能够面向无损基因测序数据压缩的参考基因组数据预处理方法,为基因测序数据的高性能无损压缩和解压算法提供充分有效的信息,能够实现对任意基因组数据样本中的短串K‑mer的相邻位的预测字符c进行预测,预测信息越准确,则可以实现对基因组数据样本实现越低的压缩率。
声明:
“基因测序数据压缩预处理方法、系统及计算机可读介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)