[サンプルプログラム]
s = 'Python' cb = s.encode('ascii') # 7ビットASCII cb = s.encode('utf-8') # 8ビット可変長エンコーディング(デフォルトのエンコード形式) cb = s.encode('latin-1') # ISO 8859-1 cp = s.encode('unicode-escape') # \uxxxxまたは\Uxxxxxxxx形式
■備考
・エンコードできない場合は、UnicodeEncodeError例外が発生する。
・エンコード文字列は大文字/小文字を区別しない(‘ascii’→’AsCiI’でも可)。
・’latin-1’、’utf-8’の代わりに、’latin1’、’utf8’でも可。
第二引数
エンコードエラーを起こしにくくするために指定する。
値 | 動作 |
---|---|
‘strict’ | デフォルト動作。ASCII以外の文字が使われているとUnicodeEncodeErrorを発生する。 |
‘ignore’ | エンコードできない文字を破棄する。 |
‘replace’ | エンコードできない文字を?に置き換える。 |
‘backslashreplace’ | \uxxxx形式。 |
‘xmlcharrefreplace’ | ウェブページで使えるエンティティ文字列(&#nnnn形式)を生成する。 |