首页 > python urllib2 字符乱码的问题

python urllib2 字符乱码的问题

r1=urllib2.Request(url,None,headers)
opener = urllib2.build_opener()
opener.addheaders.append(('Cookie', cookie_str))
response=opener.open(r1)
if response.info().get('Content-Encoding') == 'gzip':
    d = zlib.decompressobj(16+zlib.MAX_WBITS)
    #buf = StringIO( response.read())
    #f = gzip.GzipFile(fileobj=buf)
    #text = f.read()
    READ_BLOCK_SIZE = 1024*8
    stre=''
    while True:
        data = response.read(READ_BLOCK_SIZE)
        if not data: break
        stre+=data

    text = d.decompress(stre)
else :
    text=response.read()

将text写入文件后发现个别字符乱码,其他的都是正常的,不知道是怎么回事?
�t鱼养殖前景效益看好,莫失时机
鮰鱼养殖前景效益看好,莫失时机
所有的“鮰”都是乱码“�t”
环境是python 2.7,windows下,不知道该怎么解决呢?


  1. 请求还是建议使用现在比较好用的requests了。代码清晰且书写方便。

  2. 是什么编码的看看,这种情况可能是gbk编码的 先使用decode将编码转回unicode 再使用encode成utf-8即可。

  3. 还要就要要问问题。。问题和代码能详细一点吗。。


需要设置字符集为utf8

【热门文章】
【热门文章】