首页 > 甄别抄袭文章如何用JAVA去实现?甄别算法

甄别抄袭文章如何用JAVA去实现?甄别算法

如何用JAVA实现两篇文章的相似度的甄别,有没有类似的例子或者书籍、论文?


linux下,grep一下。。


谷歌用SimHash做大量网页去重,适合大文本


没写过,不过个人觉着应该主要是字符串处理吧,优先看连续字符串匹配度,是不是还有模糊匹配啊,然后看有多少处,个人看法。。。

【热门文章】
【热门文章】