python中文字符转义问题

print '中国'              #输出：中国
print ['中国']            #输出：['\xd6\xd0\xb9\xfa']
print {'中国':'中国'}      #输出: {'\xd6\xd0\xb9\xfa': '\xd6\xd0\xb9\xfa'}

请问一下为什么在list和dict打印出来是转义字符？

可以认为一个是用的是str方法，目的是向终端显示；一个用的repr方法，目的是把数据结构和类型表达出来

这是 Python 2 特别讨厌的一点，以至于我实在忍受不了写了个 repl_py27 来绕过该问题。不过最终还是迁移到 Python 3 啦 =w=

Python 2 的世界是个 ASCII 的世界，unicode 是后来加的，所以使用 repr 显示的时候是把所有非 ASCII 的字符转义显示的。你要直接把字符串写出来的话，Python 2 就不会进行任何转义了，于是在支持的终端上，中文就能正常显示了。

注意 @socrates 说的是错的。print 遇到非字符串时，会调用 str() 函数将对象转成字符串再输出：

>>> class T(object):
...   def __repr__(self):
...     return '<repr>'
...   def __str__(self):
...     return '<str>'
... 
>>> print T()
<str>

而很多对象的 __str__ 方法是没有定义的，于是 str() 函数改调用它的 __repr__ 方法。

又：Python 2 的字符串和 unicode 的 str() 输出都是经过转义的。这也是我讨厌 Python 2 的另一个重要原因：

>>> u'中文'
u'\u4e2d\u6587'
>>> '中文'                                                   
'\xe4\xb8\xad\xe6\x96\x87'

【热门文章】