首页 > UnicodeDecodeError: 'gb2312'

UnicodeDecodeError: 'gb2312'

用requests爬取一个网页,用BeautifulSoup解析
但是在print的时候一直打印乱码
然后我decode("gb2312"),因为那个网页的charset=gb2312,但是就提示:
UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 2-3: illegal multibyte sequence
但是我用gbk的话
就会通过,但是打印出一些『脦垄脨脜脜脷脫脩碌脛脟茅脠陇脌露脡芦脨隆碌脳驴茫』的文字。

新手求解!!


试一下decode("gb2312", errors="ignore")


预计你那段文字是utf8的


requests不是都会转成unicode编码吗 仔细看下文档


打印乱码的原因很多,首先是打印的载体,也就是你的终端,比如,win下的控制台,与linux下的终端支持的编码就不一样, 可能一个显示,一个不显示,还有就是一些IDE自带的终端,比如pycharm 都有可配置的编码 所以说打印出乱码,原因很多,最好你完善一下具体的信息。

【热门文章】
【热门文章】