案例背景:
Python默认支持Unicode。可用的独立Unicode字符有几百万个,这些字符中绝大多数我们使用键盘无法直接输入。

很多计算机中的字体可能在设计时就没有考虑提供这些字符,特别是Windows计算机中的字体可能无法显示这些Unicode字符。Linux和Mac OS X几乎没有关于Unicode字符的问题。

在本案例中,我们将讨论如何表示这些特别的Unicode字符。

原理:
Python使用转义序列(escape sequence)扩展普通字符。通过转义序列我们可以输入海量的 Unicode字符。转义序列以\开始,下一个字符说明Unicode字符如何表示。
常见的表示方法有两大类:

  • 根据编码进行转义:编码总是以十六进制形式出现,例如U+2680。可以使用\unnnn格式将编码填充为4位数如果编码超过4位数,可以使用\Unnnnnnnn格式将编码扩展为8位数。
  • 根据名称进行转义:\N{name},name为编码的名称。

案例:

In [1]: '\u0048\u0045\u004c\u004c\u004f'
Out[1]: 'HELLO'
In [2]: '\N{DIE FACE-1}'
Out[2]: '⚀'
In [3]: '\u2680'
Out[3]: '⚀'
In [4]: '\U00002680'
Out[4]: '⚀'
In [5]: '\U0000FFE6'
Out[5]: '₩'
GitHub 加速计划 / li / linux-dash
10.39 K
1.2 K
下载
A beautiful web dashboard for Linux
最近提交(Master分支:2 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐