在数据挖掘中除了针对数据库中数据的挖掘研究外还有对文本的挖掘研究。在互联网成为生活必不可少的组成部分的今天,网络信息充斥生活,而海量数据中哪些是有用的、需要的,而哪些又是垃圾信息,需要剔除的,如何能自动轻松的完成筛选?本文中研究的就是基于Web的文本挖掘。在进行web挖掘的时候,如何计算词语的相似度会影响到最终挖掘的效果。传统的基于知网的词语相似度算法有它的局限性,很多学者对其也进行了改进,本文从柔性逻辑的角度改进该词语相似度算法,使之能根据需要自适应的改变。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !