文字コード【超】研究
サンプルコード
ホームに戻る [0]
内容
本ページでは、株式会社ラトルズ刊「文字コード【超】研究」で扱っているサンプルプログラムを載せています。
いずれも ActivePerl で作成したものです。
純粋に実験のためのものも、結構本気で役立つものもあります。
本書を読むかたわら、ダウンロードして実験にお役立てください。
メモ
各プログラム(拡張子 .pl のファイル)のリンクをクリックすると、次のようになります。
ActivePerl を未インストールの場合:
ファイルが開いて表示されます。
サンプルコードを使用するには ActivePerl のインストールが必要です。
(ActivePerl については本書 p.596 付録3を参照してください)
ActivePerl をインストール済みの場合:
[開く]/[保存] という2つのボタンが表示されます。
[開く] をクリックするといきなり実行されます。
(ていうか、多くの場合黒い画面が一瞬よぎるだけです。)
[保存] をクリックしてお手元に保存し、コマンドプロンプトから実行してください。
ダウンロード
実験コーナー1:文字コードの入出力
- 1. sjis_hello.pl
- Shift_JIS で挨拶するプログラムです。(p.56)
- 2. euc_hello.pl
- EUC-JP で挨拶するプログラムです。(p.58)
- 3. sjis_hello_hex.pl
- 16進数で入力して Shift_JIS で挨拶するプログラムです。(p.60)
- 4. str2hex.pl
- 文字列を文字コードに変換するプログラムです。(p.61)
- 5. hex2str.pl
- 文字コードを文字列に変換するプログラムです。(p.64)
実験コーナー2:10進と2進と16進
- 1. dec2power.pl
- 10進を10のべき乗和で表すプログラムです。(p.182)
- 2. dec2hex.pl
- 10進を16進に変換表示するプログラムです。(p.190)
- 3. dec2bin.pl
- 10進を2進に変換表示するプログラムです。(p.194)
- 4. hex2dec.pl
- 16進を10進に変換表示するプログラムです。(p.196)
- 5. bin2dec.pl
- 2進を10進に変換表示するプログラムです。(p.202)
- 6. hex2bin.pl
- 16進を2進に変換表示するプログラムです。(p.204)
- 7. bin2hex.pl
- 2進を16進に変換表示するプログラムです。(p.204)
実験コーナー3:ASCII のいろいろ
- 1. ascii_tbl.pl
- ASCII のコード表を作るプログラムです。(p.266)
- 2. fdump.pl
- ファイルをダンプするプログラムです。(p.271)
- 3. ctrl_show.pl
- いろいろな制御文字を表示するプログラムです。(p.275)
- 4. mac2win.pl
- Macintosh 改行を Windows 改行に変換するプログラムです。(p.277)
実験コーナー4:JIS X 0201 のいろいろ
- 1. 80ff_tbl.pl
- 0x80〜0xff の文字コードを表示するプログラムです。(p.292)
- 2. jisX0201_7to8.pl
- JIS X 0201 7ビット構造を8ビット構造に変換するプログラムです。(p.295)
- 3. jisX0201_8to7.pl
- JIS X 0201 8ビット構造を7ビット構造に変換するプログラムです。(p.300)
実験コーナー5:いろいろな日本語コード
- 1. jis_hello_ascii.pl
- ASCII だけで入力された、JIS で挨拶するプログラムです。(p.426)
- 2. sjis_analyse.pl
-
sjis 文字列をひらがな、英字などの文字種に分別するプログラムです。(p.430)
本書ではテストデータとして
data/sjis.txt
を使っています。
- 3. sjis_kanji_analyse.pl
-
sjis 文字列を漢字も含む文字種に分別するプログラムです。(p.435)
本書ではテストデータとして
data/sjis2.txt
を使っています。
- 4. more_sjis_analyse.pl
-
sjis 文字列を文字種に分別するプログラムの完成版です。(p.435)
本書ではテストデータとして
data/sjis2.txt
を使っています。
- 5. jis2sjis.pl
-
ISO-2022-JP ファイルを Shift_JIS に変換するプログラムです。
なお、半角カナ拡張はサポートしていません。(p.444)
- 6. jis2sjisEasy.pl
-
Perl 5.8 の Encode モジュールを使い、
簡単なコードでISO-2022-JP ファイルを Shift_JIS に変換するプログラムです。
半角カナ拡張(エスケープシーケンス方式)もサポートしています。(p.448)
- 7. codefind.pl
- 文字コードを判別するプログラムです。(p.450)
実験コーナー6:Unicode の扱い
- 1. ucs4_to_utf16.pl
- UCS-4 値(16進数)をサロゲートペアを意識して UTF-16 値に変換するプログラムです。(p.518)
- 2. ucs4_to_utf8.pl
- UCS-4 値(16進数)を UTF-8 値に変換するプログラムです。(p.521)
- 3. utf8_to_utf16.pl
- UTF-8 ファイルを UTF-16 に変換するプログラムです。(p.528)
- 4. sjis_to_utf16.pl
- Shift_JIS ファイルを UTF-16 に変換するプログラムです。(p.530)
- 5. encode_list.pl
- Perl 5.8 の Encode モジュールがサポートしているエンコードの一覧表示をするプログラムです。(p.533)
- 6. jisX0212_table_make.pl
- Unicode.org の JIS X 0212 変換テーブル(文字名のみ)からコード表を生成するプログラムです。(p.535)
実験コーナー7:インターネットと文字コード
- 1. encodeBase64.pl
- バイナリーファイルを base64 に変換するプログラムです。(p.588)
- 2. decodeBase64.pl
- base64 でエンコードされたデータを復号するプログラムです。(p.589)
- 3. enttbl.pl
- ISO-8859-1 特殊文字の HTML 実体参照の一覧表を生成するプログラムです。(p.590)
- 4. unijs.pl
- Javascript の文字列を \u???? 形式の Unicode 文字列に変換するプログラムです。(p.591)
© 2003
Chihiro Fukazawa,
all rights reserved.
ホームに戻る [0]