用户输入 我是中国人
通过分词,得到 我
,是
,中国人
,
文章记录有
文章一:我
们都是
世界上最有智慧的中国人
...............
文章二:中国人
民解放军............
文章三:中国人
是
最厉害的,我们
为之感到自豪.....
......
......
从这三篇文章内容,如果是人为处理,肯定文章一最符合用户搜索意图,其次到文章三,再到文章二
不考虑关键字权重或其他,只从匹配度和模式上进行排序,如何实现以下排序?
文章一排第一:关键定匹配度高,模式相似,
文章三排第二:关键字匹配度高,模式不相似
文章二排第三:关键字匹配度低,模式不相似
栈用的是php+mysql
做到简单的搜索容易,但是要想达到你所想要的效果是复杂的算法和算法调校的过程。类似百度谷歌这样的搜索引擎更是难以简单说明的,其并不是简简单单的分词匹配的过程,还含有关键词权重、句义分析乃至用户肖像分析等复杂算法。想要简单做做就做到想要的结果,难。