Python文字列のエンコード

[サンプルプログラム]

s = 'Python'
cb = s.encode('ascii') # 7ビットASCII
cb = s.encode('utf-8')  # 8ビット可変長エンコーディング(デフォルトのエンコード形式)
cb = s.encode('latin-1')    # ISO 8859-1
cp = s.encode('unicode-escape') # \uxxxxまたは\Uxxxxxxxx形式

■備考
・エンコードできない場合は、UnicodeEncodeError例外が発生する。
・エンコード文字列は大文字／小文字を区別しない(‘ascii’→’AsCiI’でも可)。
・’latin-1’、’utf-8’の代わりに、’latin1’、’utf8’でも可。

第二引数

エンコードエラーを起こしにくくするために指定する。

値	動作
‘strict’	デフォルト動作。ASCII以外の文字が使われているとUnicodeEncodeErrorを発生する。
‘ignore’	エンコードできない文字を破棄する。
‘replace’	エンコードできない文字を?に置き換える。
‘backslashreplace’	\uxxxx形式。
‘xmlcharrefreplace’	ウェブページで使えるエンティティ文字列(&#nnnn形式)を生成する。