首页 > 请问用python抓取网页标题时如何让批量抓取二级域名的标题

请问用python抓取网页标题时如何让批量抓取二级域名的标题

# -*- coding: utf-8 -*-
import urllib
import re

d = 1000
url = 'http://gae-xseven01.appspot.com/2'
html = urllib.urlopen(url).read()
m = re.search(r'<title>(.*)</title>', html, flags=re.I)
print  m and m.group(1)or ''
i = m.group(1)
if (i == '503 Over Quota'):
    d =d-1
    print d

我有APPID从01到09.请问如何批量抓取呢


你是问 请问有人可以提供一个搭建在openshift(或者其他免费云平台)上的一个监测gae appid是否超出配额的源代码么?(供公共goagent服务端使用) 这个吧,应该说的比较清楚了,请求一下http://wwqgtxxproxy-1.appspot.com/2就可以了。

看你申请的id名字不太规律,建议你将名字放到一个数组里面,遍历数组即可。遍历数组过程中取一下对应网页标题(比如写一个获取函数),最后怎么保存结果就看你自己了

【热门文章】
【热门文章】