※有料会員になるとこの動画をご利用いただけます
詳しい説明を読む
#18:文字コード
このチャプターでは、文字コードについて学習します。
・コンピュータの内部では、文字やファイルなどが 2 進数で表現されている
・2 進数から文字に変換するための「文字コード」が定められている
・ASCII、EUC_JP、Shift-JIS、UTF-8 などがある
・ASCII はアルファベットや数字などの 1 バイト文字を数値で表現するための規則
・EUC_JP、Shift-JIS は日本語の 2 バイト文字を数値で表現するための規則
・UTF-8 は世界中の文字を一つの規則で表現する「Unicode」と呼ばれる規則の一つ
・文字コードが異なると、同じ文字でも変換する 2 進数が異なることがある
・逆に、同じ数値でも文字コードが異なれば文字が異なることがある
・文字コードが異なるファイルを開くと、別の文字に変換されてしまうことがある
・この現象を「文字化け」と呼ぶ
・iconv コマンドを用いると、指定した文字コードへの変換をおこなうことができる
# ファイルの内容を変換した結果を出力
iconv -f [変換前の文字コード] -t [変換後の文字コード] [変換元のファイル]
# 使用できる文字コードの一覧を表示
iconv -l