本发明公开了一种基于深度学习的基因组数据无损压缩方法及相关设备,所述方法包括:基于深度学习模型学习得到基因组序列的上下文关系特征和非局部特征;基于上下文关系特征和非局部特征,当输入碱基上文时,深度学习模型预测碱基上文后紧邻的多个碱基分别对应的预测概率;利用深度学习模型输出的多个碱基分别对应的预测概率连接算术编码,利用算术编码,编码待压缩碱基的概率,输出压缩结果文件。本发明通过深度学习模型学习得到基因组上下文之间的相关性,利用已压缩过的碱基序列信息,预测当前待编码碱基的概率,最后利用算术编码,输出压缩结果文件,实现了对基因组数据的无损压缩。
声明:
“基于深度学习的基因组数据无损压缩方法及相关设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)