プログラミング講座(30) Small Basicのコード系

ところで、Small Basicの扱う文字コード系はUnicode (ユニコード、UTF-8)と呼ばれるものです。
作成中の囲碁プログラムの路数を変更して、他の囲碁プログラムの棋譜ファイルを読み込ませたところ、日本語が化けてしまうことが判りました。
そもそもSGFフォーマットで日本語のコード系が許されているのか理解できていないので、ここから先は不毛な話にもなりかねないのですが、Small Basicの入門という意味で話を続けます。
試した他の囲碁プログラムではシフトJISと呼ばれるコード系が使われていました。
なんとかシフトJISからUTF-8に変換できないか調べてみましたが、Text.GetSubText()でシフトJISの文字を取り出すと必ずFFFD(16進数)というコードが返るので、Small BasicではシフトJISの情報は失われ、読み込み不能であることが判りました。
したがって結論は、Small Basicのプログラムで日本語を扱うならUTF-8コード系に甘んじるしかないということです。
【表1 日本語コード例】
文字: 日本語
UTF-8: E6 97 A5 E6 9C AC E8 AA 9E
シフトJIS: 93 FA 96 7B 8C EA
(つづく)

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。