文字コード【超】研究
サンプルコード


内容

本ページでは、株式会社ラトルズ刊「文字コード【超】研究」で扱っているサンプルプログラムを載せています。 いずれも ActivePerl で作成したものです。 純粋に実験のためのものも、結構本気で役立つものもあります。 本書を読むかたわら、ダウンロードして実験にお役立てください。

メモ

各プログラム(拡張子 .pl のファイル)のリンクをクリックすると、次のようになります。

ActivePerl を未インストールの場合:

ファイルが開いて表示されます。 サンプルコードを使用するには ActivePerl のインストールが必要です。 (ActivePerl については本書 p.596 付録3を参照してください)

ActivePerl をインストール済みの場合:

[開く]/[保存] という2つのボタンが表示されます。 [開く] をクリックするといきなり実行されます。 (ていうか、多くの場合黒い画面が一瞬よぎるだけです。) [保存] をクリックしてお手元に保存し、コマンドプロンプトから実行してください。


ダウンロード

実験コーナー1:文字コードの入出力

1. sjis_hello.pl
Shift_JIS で挨拶するプログラムです。(p.56)
2. euc_hello.pl
EUC-JP で挨拶するプログラムです。(p.58)
3. sjis_hello_hex.pl
16進数で入力して Shift_JIS で挨拶するプログラムです。(p.60)
4. str2hex.pl
文字列を文字コードに変換するプログラムです。(p.61)
5. hex2str.pl
文字コードを文字列に変換するプログラムです。(p.64)

実験コーナー2:10進と2進と16進

1. dec2power.pl
10進を10のべき乗和で表すプログラムです。(p.182)
2. dec2hex.pl
10進を16進に変換表示するプログラムです。(p.190)
3. dec2bin.pl
10進を2進に変換表示するプログラムです。(p.194)
4. hex2dec.pl
16進を10進に変換表示するプログラムです。(p.196)
5. bin2dec.pl
2進を10進に変換表示するプログラムです。(p.202)
6. hex2bin.pl
16進を2進に変換表示するプログラムです。(p.204)
7. bin2hex.pl
2進を16進に変換表示するプログラムです。(p.204)

実験コーナー3:ASCII のいろいろ

1. ascii_tbl.pl
ASCII のコード表を作るプログラムです。(p.266)
2. fdump.pl
ファイルをダンプするプログラムです。(p.271)
3. ctrl_show.pl
いろいろな制御文字を表示するプログラムです。(p.275)
4. mac2win.pl
Macintosh 改行を Windows 改行に変換するプログラムです。(p.277)

実験コーナー4:JIS X 0201 のいろいろ

1. 80ff_tbl.pl
0x80〜0xff の文字コードを表示するプログラムです。(p.292)
2. jisX0201_7to8.pl
JIS X 0201 7ビット構造を8ビット構造に変換するプログラムです。(p.295)
3. jisX0201_8to7.pl
JIS X 0201 8ビット構造を7ビット構造に変換するプログラムです。(p.300)

実験コーナー5:いろいろな日本語コード

1. jis_hello_ascii.pl
ASCII だけで入力された、JIS で挨拶するプログラムです。(p.426)
2. sjis_analyse.pl
sjis 文字列をひらがな、英字などの文字種に分別するプログラムです。(p.430)
本書ではテストデータとして data/sjis.txt を使っています。
3. sjis_kanji_analyse.pl
sjis 文字列を漢字も含む文字種に分別するプログラムです。(p.435)
本書ではテストデータとして data/sjis2.txt を使っています。
4. more_sjis_analyse.pl
sjis 文字列を文字種に分別するプログラムの完成版です。(p.435)
本書ではテストデータとして data/sjis2.txt を使っています。
5. jis2sjis.pl
ISO-2022-JP ファイルを Shift_JIS に変換するプログラムです。 なお、半角カナ拡張はサポートしていません。(p.444)
6. jis2sjisEasy.pl
Perl 5.8 の Encode モジュールを使い、 簡単なコードでISO-2022-JP ファイルを Shift_JIS に変換するプログラムです。 半角カナ拡張(エスケープシーケンス方式)もサポートしています。(p.448)
7. codefind.pl
文字コードを判別するプログラムです。(p.450)

実験コーナー6:Unicode の扱い

1. ucs4_to_utf16.pl
UCS-4 値(16進数)をサロゲートペアを意識して UTF-16 値に変換するプログラムです。(p.518)
2. ucs4_to_utf8.pl
UCS-4 値(16進数)を UTF-8 値に変換するプログラムです。(p.521)
3. utf8_to_utf16.pl
UTF-8 ファイルを UTF-16 に変換するプログラムです。(p.528)
4. sjis_to_utf16.pl
Shift_JIS ファイルを UTF-16 に変換するプログラムです。(p.530)
5. encode_list.pl
Perl 5.8 の Encode モジュールがサポートしているエンコードの一覧表示をするプログラムです。(p.533)
6. jisX0212_table_make.pl
Unicode.org の JIS X 0212 変換テーブル(文字名のみ)からコード表を生成するプログラムです。(p.535)

実験コーナー7:インターネットと文字コード

1. encodeBase64.pl
バイナリーファイルを base64 に変換するプログラムです。(p.588)
2. decodeBase64.pl
base64 でエンコードされたデータを復号するプログラムです。(p.589)
3. enttbl.pl
ISO-8859-1 特殊文字の HTML 実体参照の一覧表を生成するプログラムです。(p.590)
4. unijs.pl
Javascript の文字列を \u???? 形式の Unicode 文字列に変換するプログラムです。(p.591)

© 2003 Chihiro Fukazawa, all rights reserved.

Valid HTML 4.01!