搜索引擎算法之:谨慎对待同义词
来源:昆明多彩网络公司 日期:2011-02-20 阅读: 发表评论
在搜索引擎中有一个很重要的分词技术,比如将一个长的词语分解成若干个短语,然后再根据这些短语呈现最终的搜索结果,而我们这里说得同义词并非搜索引擎中的分词技术,说的是一个该怎么样去理解用户意图的技术。
比如说我们搜索“网站制作”和“网页制作”这两个同义词语,可以对比一下搜索出来的结果,发现还是有很多不同的,虽然这两个词语的意思基本相同;而我们再搜索竞争较小的同义词的时候就可以发现搜索结果相似程度的就出现上升趋势。
这里我们可以大胆的猜测一下影响搜索引擎对于同义词搜索结果的相关因素:
1、两个同义词如果意义非常接近,同时相关信息较少的话,搜索引擎会自动匹配这两个词语,并且呈现大部分相同的结果。
2、两个同义词意义非常接近,但是词语的搜索指数很高,同时相关的网站竞争排名也非常激烈,那么呈现出来的结果就会迥异。
3、如果两个同义词前面加上了地域或者其他限制性的前缀,搜索引擎会考虑将这两个词语当成一个关键词来对待,但几率较小。
4、对于冷门和一些专业术语,搜索引擎如果在自身数据库中有两个同义词的数据,将同义词当成一个关键对待的几率将大大加大。
以上猜测仅参考了少部分的搜索词语,搜索引擎对于同义词的匹配和对待的态度是非常的谨慎,更多更准确的数据就需要更多的关键词语去验证了。
发表评论评论列表(有 条评论)