首页 > 搜索引擎,匹配度是如何算出来的?

搜索引擎,匹配度是如何算出来的?

用户输入 我是中国人

通过分词,得到 ,,中国人,

文章记录有

文章一:们都世界上最有智慧的中国人...............
文章二:中国人民解放军............
文章三:中国人 最厉害的,我们为之感到自豪.....
......
......

从这三篇文章内容,如果是人为处理,肯定文章一最符合用户搜索意图,其次到文章三,再到文章二

不考虑关键字权重或其他,只从匹配度和模式上进行排序,如何实现以下排序?

文章一排第一:关键定匹配度高,模式相似,

文章三排第二:关键字匹配度高,模式不相似

文章二排第三:关键字匹配度低,模式不相似

栈用的是php+mysql


做到简单的搜索容易,但是要想达到你所想要的效果是复杂的算法和算法调校的过程。类似百度谷歌这样的搜索引擎更是难以简单说明的,其并不是简简单单的分词匹配的过程,还含有关键词权重、句义分析乃至用户肖像分析等复杂算法。想要简单做做就做到想要的结果,难。

【热门文章】
【热门文章】