print '中国' #输出:中国
print ['中国'] #输出:['\xd6\xd0\xb9\xfa']
print {'中国':'中国'} #输出: {'\xd6\xd0\xb9\xfa': '\xd6\xd0\xb9\xfa'}
请问一下为什么在list和dict打印出来是转义字符?
可以认为一个是用的是str方法,目的是向终端显示;一个用的repr方法,目的是把数据结构和类型表达出来
这是 Python 2 特别讨厌的一点,以至于我实在忍受不了写了个 repl_py27 来绕过该问题。不过最终还是迁移到 Python 3 啦 =w=
Python 2 的世界是个 ASCII 的世界,unicode 是后来加的,所以使用 repr
显示的时候是把所有非 ASCII 的字符转义显示的。你要直接把字符串写出来的话,Python 2 就不会进行任何转义了,于是在支持的终端上,中文就能正常显示了。
注意 @socrates 说的是错的。print 遇到非字符串时,会调用 str()
函数将对象转成字符串再输出:
>>> class T(object):
... def __repr__(self):
... return '<repr>'
... def __str__(self):
... return '<str>'
...
>>> print T()
<str>
而很多对象的 __str__
方法是没有定义的,于是 str()
函数改调用它的 __repr__
方法。
又:Python 2 的字符串和 unicode 的 str()
输出都是经过转义的。这也是我讨厌 Python 2 的另一个重要原因:
>>> u'中文'
u'\u4e2d\u6587'
>>> '中文'
'\xe4\xb8\xad\xe6\x96\x87'