本发明公开了一种基于共现分析和谱聚类的医疗数据信息检索方法,对检索任务词汇进行查询扩展,将扩展后的检索任务词汇分类为检索词、扩展词和特征词,对文献进行首次记分,如果首次得分大于阈值T则选中文献,小于阈值T则放弃文献;对选中文献进行二次计分和共现分析,得到二次得分和共现得分,并通过首次得分、二次得分和共现得分计算文献的综合得分;使用词袋模型将文献的化学词列表、医学主题词列表、摘要和关键词列表组成描述文献的向量,以向量距离矩阵作为谱聚类的输入对选中文献进行聚类,输出聚类簇;输出平均综合得分最高的那个类作为检索结果,并对检索结果中的文献按综合得分进行降序排序输出。
声明:
“基于共现分析和谱聚类的医疗数据信息检索方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)