文字コード【超】研究
内容紹介
ホームに戻る [0]
第1部 原理編
第1章 バイナリーとテキスト
- 1-1 Webページ講座でのヒトコマ
- 1-2 メモ帳に放り込むと
- 1-3 メモ帳に放り込んでも読めないテキスト?
- 1-4 ここで再度文字コードの原理を考える
- 1-5 Windowsで文字コードと付き合う
- 1-6 バイナリーファイルを無理矢理メモ帳に入れると
実験コーナー 1:文字コードの入出力
- 1. Shift_JISで挨拶するsjis_hello.pl
- 2. euc-jpで挨拶するeuc_hello.pl
- 3. 進数で入力してShift_JISで挨拶するsjis_hello_hex.pl
- 4. 文字列を文字コードに変換するstr2hex.pl
- 5. 文字コードを文字列に変換するhex2str.pl
第2章 テキストファイルのいろいろ
- 2-1 テキスト文書
- 2-2 設定ファイル
- 2-3 プログラムとテキストファイル
- 2-4 HTML
- 2-5 ここまでのまとめ
第3章 バイナリーファイルのいろいろ
- 3-1 デジタルとアナログ
- 3-2 アナログ記録
- 3-3 画像ファイル
- 3-4 音声ファイル
- 3-5 動画ファイル
- 3-6 デジタル記録とは――まとめ
第4章 コンピュータと文字
- 4-1 文字って何だろう
- 4-2 肉筆、肉声はアナログ
- 4-3 コンピュータの文字はデジタル
- 4-4 書式と内容
- 4-5 フォントとは何か
- 4-6 フォントのいろいろ
第5章 2進数、16進数の計算
- 5-1 10進数と位取り記数法の基本
- 5-2 16進数の基本
- 5-3 2進数の基本
- 5-4 2進数と16進数はなかよし
- 5-5 ビットとバイト
実験コーナー 2:10進と2進と16進
- 1. 10進を10のべき乗和で表すdec2power.pl
- 2. 10進を16進に変換表示するdec2hex.pl
- 3. 10進を2進に変換表示するdec2bin.pl
- 4. 16進を10進に変換表示するhex2dec.pl
- 5. 2進を10進に変換表示するbin2dec.pl
- 6. 16進を2進に変換表示するhex2bin.pl
- 7. 2進を16進に変換表示するbin2hex.pl
- 8. 簡易電卓プログラムcalc.pl
- 9. 実はもっとカンタンな方法が…
第6章 規格と機関
- 6-1 ISO
- 6-2 JIS
- 6-3 ANSI
- 6-4 RFC
- 6-5 Unicodeコンソーシアム
- 6-6 まとめ
第2部 さまざまな文字コード
第7章 文字コード系の歴史総まくり
- 7-1 ISO 646系
- 7-2 非ISO 646系
- 7-3 ISO 2022系
- 7-4 非ISO 2022系
- 7-5 ISO 10646/Unicode系
第8章 ASCII
- 8-1 ASCIIは7ビットコード
- 8-2 制御文字と図形文字
- 8-3 図形文字のいろいろ
実験コーナー 3:ASCIIいろいろ
- 1. ASCIIのコード表を作るascii_tbl.pl
- 2. ファイルをダンプするfdump.pl
- 3. いろいろな制御文字を表示するctrl_show.pl
- 4. Macintosh改行をWindows改行に変換するmac2win.pl
第9章 JIS X 0201 (JIS C 6220)
実験コーナー 4:JIS X 0201いろいろ
- 1. x80〜0xffを表示する80ff_tbl.pl
- 2. JIS X 0201 7ビット構造を8ビット構造に変換するjisX0201_7to8.pl
- 3. JIS X 0201 8ビット構造を7ビット構造に変換するjisX0201_8to7.pl
第10章 ISO 2022
- 10-1 7ビット系
- 10-2 8ビット系
- 10-3 エスケープシーケンスいろいろ
- 10-4 実際の運用
第11章 ISO 8859-1
- 11-1 ISO 8859-1文字コード表
- 11-2 その他のISO 8859
- 11-3 ラテン文字の入力
第12章 JIS X 0208
- 12-1 ISO 2022準拠の文字コードとしてのJIS X 0208
- 12-2 94×94の区点コード
- 12-3 1978、1983、1990、1997版の相違点
- 12-4 含まれる文字
第13章 JIS X 0212
- 13-1 JIS X 0212のコード表
- 13-2 含まれる文字
- 13-3 エスケープシーケンス
第14章 JIS X 0213
- 14-1 JIS X 0213のコード表
- 14-2 含まれる文字
第15章 ISO-2022-JP
- 15-1 ISO-2022-JP(RFC 1468)
- 15-2 その他のISO-2022-JPファミリー
第16章 EUC-JP
- 16-1 圧縮表現と固定長表現
- 16-2 原理
- 16-3 検証
- 16-4 EUC-JISX0213
第17章 Shift_JIS
- 17-1 原理
- 17-2 検証
- 17-3 0x5c問題
- 17-4 Shift_JISX0213
第18章 Windowsの独自拡張とコードページ
- 18-1 CP437
- 18-2 CP1252
- 18-3 CP932
実験コーナー5:いろいろな日本語コード
- 1. ASCIIで入力してJISで挨拶するjis_hello_ascii.pl
- 2. sjis文字列を分別するsjis_analyse.pl
- 3. sjis文字列から漢字を分別するsjis_kanji_analyse.pl
- 4. さらにsjis文字列を分別するmore_sjis_analyse.pl
- 5. ISO-2022-JPをShift_JISに変換するjis2sjis.pl
- 6. ISO-2022-JPをShift_JISにカンタンに変換するjis2sjisEasy.pl
- 7. 文字コードを自動判別するcodefind.pl
第19章 Unicode
- 19-1 19-1 原理
- 19-2 19-2 ネット上のUnicode資料を研究する
- 19-3 19-3 Block.txtで各ブロックを横断する
- 19-4 19-4 既存文字コード系との対応関係
実験コーナー6:Unicodeの扱い
- 1. UCS-4値をUTF-16値に変換するucs4_to_utf16.pl
- 2. UCS-4値をUTF-8に変換するucs4_to_utf8.pl
- 3. UTF-16ファイルをUTF-8に変換するutf8_to_utf16.pl
- 4. Shift_JISファイルをUTF-16に変換するsjis_to_utf16.pl
- 5. Encodeがサポートしているエンコードの一覧表示encode_list.pl
- 6. JIS X 0212のコード表を作るjisX0212_table_make.pl
第20章 文字セットにない文字を表現する方法
- 20-1 外字を使う
- 20-2 画像を使う
- 20-3 Unicodeを使う
- 20-4 説明する
第21章 大文字だいもじセット、大文字だいもじコード
- 21-1 今昔文字鏡こんじゃくもじきょう
- 21-2 e漢字いーかんじ
- 21-3 GT明朝
第3部インターネット編
第22章 インターネットと文字コード
- 22-1 FTP
- 22-2 電子メール
- 22-3 HTML
- 22-4 XML
- 22-5 JavaScript
実験コーナー7:インターネットと文字コード
- 1. base64へのエンコードencodeBase64.pl
- 2. BASE64からのデコードdecodeBase64.pl
- 3. 実体参照の一覧表の作成enttbl.pl
- 4. JavaScriptの文字列を全部Unicode化するunijs.pl
付録
- 付録1:本書のサポートサイトについて
- 付録2:本書で使用するフリーウェア
- 付録3:ActivePerlの使い方
- インストール前に必要なもの
- インストールするバージョン
- インストール
- Perl用ディレクトリを作ってPATHを通す
- はじめてのスクリプト
- cmd.exeへのショートカットを作る
- 実行
- Windows 95/98/Meの場合
- 付録4:参考図書
あとがき
© 2003
Chihiro Fukazawa,
all rights reserved.
ホームに戻る [0]