首页 > 这样的验证码该如何识别?

这样的验证码该如何识别?


先截取下来,然后使用tesseract进行识别。一般tesseract如果识别不了,可以试试一些google的一些机器学习的库,或者使用第3方平台进行识别。


像这类验证码,一共也只有26个大写字母,可以尝试自己写识别算法(完全符合要求的第三方库比较难找):

  1. 灰度化、二值化、去噪

  2. 将一张完整的图片切成5份,每一份1个字母;

  3. 使用【学习算法(简单的如kNN)+ 识别库】识别图片,获取字母;

  4. 如果识别不出来,刷新验证码回到1或随机猜一个字母;

  5. 5个字母都识别后,去验证;

  6. 验证通过后,将5张图片以及对应识别出来的字母加入识别库;

  7. 验证失败,刷新验证码,回到1

识别库中每一个字母有多张对应的图片,这个工作早期需要自己做,有一定成功率就用学习算法自己去下载验证码图片、自己去验证、增长识别库,从而提高识别率。

【热门文章】
【热门文章】