首页 > 抓取百度数据,被重定向,如何解决

抓取百度数据,被重定向,如何解决

最近需要抓取百度百科,知道的数据。不需要太多,几万条就够了。

发现抓到几百条,就被重定向了。

想知道,一般大网站是如何防爬虫的,他们如何定位一个未知用户,我是从学校的ip出去的。

这个问题如何解决:
1.减少访问频次(已经很慢了)
2.useragent 轮询


菜鸟补充2点: * 随机IP(淘宝上买代理) * 偶尔访问下百度首页

一个叫RankTracker的排名批量查询工具就是使用这个思路。

等高手补充。

【热门文章】
【热门文章】