#01:文字コードを理解しよう
ここでは、コンピュータで文字情報をあつかうために利用する文字コードについて学習します。COMETⅡでは、JIS X 0201という規格で定められた文字コードを利用します。
$ pycasl hello.cas
$ pycomet hello.com
コンピュータで文字を扱うため、1文字ごとにあたえた識別番号
「1」 ⇒ 0011 0001、#31
「A」 ⇒ 0100 0001、#41
- 多くのコンピュータやソフトウェアは、共通の文字コード表を使う
- いくつかの種類がある
- どの言語のどの文字を収録するか
- どのように識別番号を割り当てるか
- ASCII:英数字や記号、改行などの制御文字、7ビットであらわす
- JIS X 0201:ASCIIを8ビットに拡張
- 「\」(バックスラッシュ)を「¥」(エンマーク)に、
- 「~」(チルダ)を、「‾」(オーバーライン)に置き換え
- 8ビット領域にカタカナと句読点や濁点・半濁点を追加
- CASLⅡとCOMETⅡで利用
1バイト文字 > 最大8ビット = 1バイトで表現できる文字コード
マルチバイト文字 > 漢字や多言語をあつかう(UTF-8、UTF-16)
数字の「1」:列 = 03、行 = 1 ⇒ #31
数字の「A」:列 = 04、行 = 1 ⇒ #41
CASLⅡでテキストを指定
- アセンブルして文字コードに置き換える
- 上位ビットはゼロになる
「#0048」⇒ H 「#48」
「#0065」⇒ e 「#65」
「#006c」⇒ l 「#6c」
「#006c」⇒ l 「#6c」
「#006f」⇒ o 「#6f」
文字コード(キャラクターコード)とは - IT用語辞典 e-Words
http://e-words.jp/w/%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89.html
ASCII(アスキーコード)とは - IT用語辞典 e-Words
http://e-words.jp/w/ASCII.html
JIS X 0201 - Wikipedia
https://ja.wikipedia.org/wiki/JIS_X_0201
半角文字(ANK文字)とは - IT用語辞典 e-Words
http://e-words.jp/w/%E5%8D%8A%E8%A7%92%E6%96%87%E5%AD%97.html
半角カナ - Wikipedia
https://ja.wikipedia.org/wiki/%E5%8D%8A%E8%A7%92%E3%82%AB%E3%83%8A
1バイト文字(シングルバイト文字)とは - IT用語辞典 e-Words
http://e-words.jp/w/1%E3%83%90%E3%82%A4%E3%83%88%E6%96%87%E5%AD%97.html
CASLIIアセンブラ & シミュレータ PyCASL2 & PyCOMET2
http://www.image.med.osaka-u.ac.jp/member/nakamoto/pycasl2/index.html
CASL - Wikipedia
https://ja.wikipedia.org/wiki/CASL
アセンブラ言語CASL2の仕様
https://www.chiba-fjb.ac.jp/fjb_labo/casl/CASL2spec.html#2-3
システムCOMET2の仕様
https://www.chiba-fjb.ac.jp/fjb_labo/casl/COMET2spec.html
CPU - コンピュータの基礎知識 | ++C++; // 未確認飛行 C
https://ufcpp.net/study/computer/CPU.html