首页 > Python爬虫中编码设置问题,系统编码如何正确处理?

Python爬虫中编码设置问题,系统编码如何正确处理?

有个问题想请交一下。Python中为了确定源文件的编码,所以在文件第一行可以进行设置。在Windows下最简单的方法例子就是#coding=utf-8(Linux下还需要加一行的样子,(不确定))。然后我导入了sys模块,print sys.getdefaultencoding()来看一下默认的编码方式,结果还是ascii而不是utf-8。不解下一步要如何解决这个问题,据说Python3都是utf-8编码的。其次,在Python文件输入unicode时会成为一个类型,而我输入utf-8,或者ascii是会报错没有这个变量之类的。这个问题是如何解决的?谢谢!

题主系统为win7


你可以这样:

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

应该就可以


将所有的输入内容decodedecode后字符串格式为unicode,然后统一encode后输出,utf-8还是GBK随便你。

推荐阅读
PYTHON-进阶-编码处理小结
Pragmatic Unicode

其实你提问我就没看很明白。还是推荐你先了解了解字符编码相关知识吧

【热门文章】
【热门文章】