r1=urllib2.Request(url,None,headers)
opener = urllib2.build_opener()
opener.addheaders.append(('Cookie', cookie_str))
response=opener.open(r1)
if response.info().get('Content-Encoding') == 'gzip':
d = zlib.decompressobj(16+zlib.MAX_WBITS)
#buf = StringIO( response.read())
#f = gzip.GzipFile(fileobj=buf)
#text = f.read()
READ_BLOCK_SIZE = 1024*8
stre=''
while True:
data = response.read(READ_BLOCK_SIZE)
if not data: break
stre+=data
text = d.decompress(stre)
else :
text=response.read()
将text写入文件后发现个别字符乱码,其他的都是正常的,不知道是怎么回事?
�t鱼养殖前景效益看好,莫失时机
鮰鱼养殖前景效益看好,莫失时机
所有的“鮰”都是乱码“�t”
环境是python 2.7,windows下,不知道该怎么解决呢?
请求还是建议使用现在比较好用的requests了。代码清晰且书写方便。
是什么编码的看看,这种情况可能是gbk编码的 先使用decode将编码转回unicode 再使用encode成utf-8即可。
还要就要要问问题。。问题和代码能详细一点吗。。
需要设置字符集为utf8