您好,欢迎来到爱站旅游。
搜索
您的当前位置:首页一种基于主客观语义的双层次文本相似度计算方法[发明专利]

一种基于主客观语义的双层次文本相似度计算方法[发明专利]

来源:爱站旅游
专利内容由知识产权出版社提供

专利名称:一种基于主客观语义的双层次文本相似度计算方法专利类型:发明专利

发明人:成卫青,吴旭东,黄卫东,范恒亮申请号:CN201310129124.5申请日:20130415公开号:CN103678275A公开日:20140326

摘要:基于主客观语义的双层次文本相似度计算方法具有如下特征:本发明将文本分为题目和正文两个层次,通过过滤构建题目-词语向量,通过提取关键词构建较低维度的正文-词语向量,并将主客观结合的词语语义相似度计算方法用于词语向量相似度的计算,分别得到题目和正文的相似度,进而得到文本相似度;基于《知网》和语料库的词语-文本索引计算词语语义相似度,使词语表达简洁,计算结果能既符合主观概念又符合客观语义环境;文本相似度计算中,题目和正文并重,且将主客观结合的词语语义相似度计算方法运用其中,避免了高维度的文本-词语向量,充分提取了文本信息,提高了文本相似度结果的准确度,且适用于各种情况下文本的相似性分析。

申请人:南京邮电大学

地址:210003 南京市鼓楼区新模范马路66号

国籍:CN

代理机构:南京知识律师事务所

代理人:汪旭东

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- azee.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务