首页 > 用Python爬网页需要了解什么背景知识?

用Python爬网页需要了解什么背景知识?

最近在学Python爬虫,写脚本进行模拟登录时,对很多名词一知半解,例如:
cookie, header, agent, proxy, timeout, HTTPError, URLError……
感觉这些词多少都听过,但也谈不上真的知道。所以跟着教程写东西时,稍微需要点变通就容易束手无策。

求问有什么书或者网络资源,是可以比较系统性的介绍这块内容的吗?


HTML DOM结构,正则表达式, HTML解析库(Beautifulsoup4),http请求库(urllib,requests),一定的数据库基础


如果要视频教程推荐上慕课网看看,http://www.imooc.com/video/12622 这么课和配套课程你可以看看,书的话推荐图灵出品http://www.ituring.com.cn/boo...这本网络采集。
然后随时翻看wiki和google即可

【热门文章】
【热门文章】