文字コード【超】研究
正誤表


本ページの内容

本ページでは、株式会社ラトルズ刊「文字コード【超】研究」で刊行後に発見された誤りと訂正を載せています。 大変ご迷惑をおかけしますが、訂正をお願いします。 また、誤りとはいえないまでも、誤解をまねく表現の向上も行っています。 その場合アスタリスク(*) がついています。 なお、ご指摘いただいた方にこの場を借りてお礼申し上げます。

最終更新日:2004/08/13


正誤表

第1版第2刷

以下は第1刷および第2刷の誤りです。(ちなみに、刷は「すり」と読みます。)

第2刷の誤りは第1刷から累積してますので、第1刷をお買い求めの方は下の第1刷と合わせてご参照ください。

起票日 ページ 箇所 現状 訂正後
2004/06/24 p.133 真ん中の下 16 進数の場合は 0 から f までの 15 個の数字を使います。1 16 進数の場合は 0 から f までの 16 個の数字を使います。1
2003/10/15 p.251 見出し「ISOで使うもの」から4行目 コード:0xb1 コード:0x1b
2003/10/15 p.264 COLUMN「チルダとオーバーライン内」(3箇所) 0x8e 0x7e
2003/11/11 p.276 ページ下の表 0x0f => FF、0x0b => BS、0x0a => BEL 0x0c => FF、0x08 => BS、0x07 => BEL
2003/10/15 p.282 下から6行目 0x5eがチルダ(〜)ではなくてオーバーライン( ̄)であること 0x7eがチルダ(〜)ではなくて・・・
2003/10/25 p.283 図9.1 左面(基底状態およびSIのあと)の5列C行がバックスラッシュ(\) 円記号(¥)が正しい(JIS X 0201 だから)
2003/10/25 p.284 本文下から4行目 Jがそのままハと表示されてしまっています。 がそのままJと表示されてしまっています。
2003/10/31 p.304 図10.1 右肩のキャプション ASCIIは・・・固定するコード系であ ASCIIは・・・固定するコード系である。
2003/10/25 p.305 1行目(図10.2の下) 両方とも0x21〜0xfeを使うとすると 両方とも0x21〜0x7eを使うとすると
2003/10/25 p.322 11.1「ISO 8859-1文字コード表」本文1行目 ・・・0x80〜0x1fはC1制御文字です。 ・・・0x80〜0x9fはC1制御文字です。
2003/10/25 p.322 11.1「ISO 8859-1文字コード表」本文1行目 ・・・残りのGL(0xa0〜0xff)にラテン文字1と呼ばれる ・・・残りのGR(0xa0〜0xff)にラテン文字1と呼ばれる
2003/10/25 p.338 本文下から3行目 第1バイトを区(ward) 第1バイトを区(row
2004/08/13 p.406 本文上から5行目 「Shift_JIS は非モード式で・・・」以降全体 おたよりコーナー 2 に改訂版を掲載
2003/10/30 p.410 本文中ほど もう一つ、図17.4のような実験をしてみます。 もう一つ実験をしてみます。「表示」「侮ヲ」と書いたファイルを作ってダンプしてみましょう。
2003/10/25 p.428 本文2段落目 図4はwincode1.bmpをxyzzyで表示・・・ 図4はwincode1.txtをxyzzyで表示・・・
2004/08/13 p.471 訂正前 訂正後
2004/08/13 p.461 図の下 (右のメモを挿入します) (メモ)Unicode Consortium は UTF-16 の使用を推進しており、UTF-16 収録可能範囲の UCS-4 0 群 16 面までの収録しか許さないだろうとのことです。
2004/08/13 p.471 末尾 (右のメモを挿入する) UTF-8 で 4 バイトに入るまでのコード範囲は、サロゲートペアを含む UTF-16 で表現できるコード範囲に相当します。Unicode Consortium は UTF-16 の使用を推進し、UTF-16 の範囲に入らない文字を許さないだろうということなので、UTF-8 も将来に渡って 4 バイトと考えられます。
2004/08/13 p.476 箇条書きの 2 つめ UTF-32 には BE と LE がある。UCS-4 の 0xAAAABBBB という字を BE で表現すると U+AAAABBBB のままになるが、LE で表現すると 16 ビットごとに反転して U+BBBBAAAA になる。ワード(16 ビット)単位で反転するので注意 UTF-32 には BE と LE がある。UCS-4 の 0xAABBCCDD という字を BE で表現すると 0xAABBCCDD のままになるが、LE で表現すると 8 ビットごとに反転したものがさらに 16 ビットごとに反転して U+DDCCBBAA になる。
2004/08/13 p.504 末尾メモ ここまでが UTF-8 では 3 バイトの文字です。また、ここまでが UTF-16 で 2 バイトの文字です。(以降はサロゲートペアを使って表現します。) ここまでが UTF-8 では 3 バイトの文字です。また、ここまでが UTF-16 で 2 バイトの文字です。(以降はサロゲートペアを使って表現します。)なお、これ以降の文字はすべて UTF-8 で 4 バイトで表現されます。UTF-8 で 5 バイト以上の文字は、当面は存在しません。
2004/08/13 p.505 下の方のメモ ここまでが UTF-8 では 4 バイトの文字です。これ以降はすべて 5 バイトで表現されます。ぼくが生きているうちに UTF-8 で 6 バイトが必要な字は現れないと思います。 左のメモを削除します。(5 バイトの UTF-8 は存在しません。くわしくはおたよりコーナー2を参照してください。
2003/11/10 p.601 バッチファイルの中 go to endofperl goto endofperl

第1版第1刷

以下は第1刷の誤りで第2刷で修正されたものです。

起票日 ページ 箇所 現状 訂正後
2003/07/26 p.24 中へん で、慣習的にこの左のゼロも読みます。(*) で、慣習的に補ったゼロも読みます。
2003/7/26 p.30 真ん中下のメモ コード表でこれらの字が「CR(0x0d)」「LF(0x0d)」と…… ……「CR(0x0d)」「LF(0x0a)」と……
2003/07/26 p.58 真ん中上へん さっきと変わりませんね。(*) さっきと変わりませんね。(厳密にはコメントを変えていますが…)
2003/08/04 p.63 前半のメモ …改行や空白はこのプログラムを使って研究できません。(*) …改行や空白はこのプログラムを使って研究できません。(ただし、引数全体を二重引用符 " " で囲めば空白は渡すことができます。)
2003/07/26 p.64 下の実験入力 起動しているプログラムが str2hex.pl hex2str.pl
2003/07/26 p.65 冒頭、プログラム名見出し str2hex.pl hex2str.pl
2003/07/26 p.65 冒頭、プログラム名注釈 str2hex.pl -- 文字列を入力してコード値を表示する hex2str.pl -- 16 進数を入力して文字列を表示する
2003/08/03 p.93 下から2段落目 ここでの電子回路の処理を D/A 変換(Digital/Analog conversion)… ここでの電子回路の処理を A/D 変換(Analog/Digital conversion)
2003/08/03 p.94 上から2段落目 この処理を A/D 変換と言います。 この処理を D/A 変換と言います。
2003/07/26 p.107 図4.9 (本体はエンターテインメント) 本来は…)
2003/07/26 p.112 本文中ほど(他にもあり) (「タチザキ」は立+奇と説明している) 注1:タチザキについてを参照)
2003/09/05 p.139 一番下のメモ CやPerlでべき乗を計算するには・・・ Perlでべき乗を計算するには・・・
2003/07/26 p.196 上の実験入力 hex2dec.pl 1b2b3c hex2dec.pl 1a2b3c
2003/07/26 p.202 下半分の実験入力 hex2dec.pl 11011011 bin2dec.pl 11011011
2003/08/18 p.204 本文中段 これは、hex2bin.pl を改造すればすぐできます。 これは、hex2dec.pl を改造すればすぐできます。
2003/08/18 p.204 本文中段 では hex2bin.pl を改造した答えです。 では hex2dec.pl を改造した答えです。
2003/08/10 p.264 コラム「チルダとオーバーライン」1行目 ・・・〜のように天地中央どりにしていますか。フォントでは・・・ ・・・〜のように天地中央どりにしていますが、フォントは・・・
2003/08/18 p.309 下表、機能の欄 「C0のロッキングシフト」「C2のシングルシフト」など G0のロッキングシフト」「G2のシングルシフト」など
2003/08/18 p.312 本文下段 GR は Graphic Left という意味で GR は Graphic Right という意味で
2003/08/18 p.313 下表 16 進値の ESC は 0x1b の誤記、機能の C0〜C3 は G0〜G3 の誤記 注2:ISO 2022 8ビット系の制御文字表を参照
2003/08/18 p.315 2行目/3行目 GLおよびGLに呼び出し GLおよびGRに呼び出し
2003/08/18 p.318 下から7行目 JIS X 0212をG0に指示する場合は「ESC $ ( D」、G1 に指示する場合は「ESC $ ( D」 ・・・G1 に指示する場合は「ESC $ ) D」
2003/08/18 p.318 下から6行目 さて、そろそろ読むのも飽きてきたと思いますがが、 さて、そろそろ読むのも飽きてきたと思います
2003/08/08 p.328 図11.5の3行目「ラテン文字3」のISO 2022終端文字 B(0x42) C(0x43)
2003/08/24 p.333 メモ gates.el Gates.l
2003/08/24 p.336 本文2行目 1978年に日本で制定されたJIS X 0201 1978年に日本で制定されたJIS X 0208
2003/08/11 p.347 中へん これを包摂基準といいます。 これを包摂準といいます。
2003/07/26 p.436〜437 図10、11の実験入力 sjis_analyse_kanji.pl sjis2.pl sjis_kanji_analyse.pl sjis2.pl
2003/09/05 p.465 図19.6 (U+20009を丸で囲んでいる) (U+2000Bを囲むべき)
2003/08/08 p.476 最終行 …BE の BOM は 0x0000FFFE、LE の BOM は 0xFFFE0000 …BE の BOM は 0x0000FEFF、LE の BOM は 0xFFFE0000
2003/08/24 p.479 「字母」のふりがな チョモ
2003/09/05 p.490 下から2行目 問題は、中国と日本で韓国で同じ漢字とみなされる字の字形が、 中国と日本韓国で同じ漢字とみなされる字の字形が、
2003/08/08 p.492 コラム本文最終行 (シノ)はJIS X 0213で面区点番号2-13-41に収録されました。 (シノ)はJIS X 0213で面区点番号2-83-41に収録されました。
2003/08/17 p.498 シンハラ文字の説明 (マレーシアの公用語シンハラ語の文字) スリランカの公用語シンハラ語の文字)
2003/08/24 p.503 上の方 Kiyoak A Mieum Kiyeak A Mieum
2003/08/24 p.503 真ん中の段落1行目 10,733種類 11,172種類
2003/08/24 p.503 中へん Johab(チョハブ:組み合わせという意味) Johab(チョハブ:「組合」という漢字のハングル読み)
2003/07/26 p.518 上の実験入力 出力結果が D840 DC0Bd840 dc0b(小文字)
2003/07/28 p.580 本文の4行目 …ISO 8859-1 のファイルを quoted-pruintable で… …ISO 8859-1 のファイルを quoted-printable で…
2003/09/05 p.594 xyzzy の説明 gates.pl Gates.l
2003/08/02 p.607 あとがきの献辞 技術評論者の 技術評論の(大変失礼しました…

注1:タチザキについて

異体字の例として、ツチヨシ、ハシゴダカと並んで3大人名漢字と呼ばれるタチザキを取り上げ、 初版1刷の p.112 などで多く書いていますが、この字の形を筆者は完全に勘違いしてい、 あろうことか存在しない字を作字して印刷してもらっています。

(現状)(趣旨を要約したもので、そういう文章があるわけではありません)

「崎」の異字体でタチザキと呼ばれるものがあります。 これは「崎」の山偏が「立」になったもの、 つまり [「崎」の山偏が「立」になった文字] です。

(訂正後)

「崎」の異字体でタチザキと呼ばれるものがあります。 これは「崎」のつくりの上半分の「大」が「立」になったもの、 つまり [「崎」のつくりの上半分の「大」が「立」になった文字] です。

大変申し訳ありませんが、上記のようにご了解ください。

注2:ISO 2022 8ビット系の制御文字表

全体的に微妙に間違っています。

まず「16進値」のカラムの 4〜7 行目ですが、ESC と文字名で書かれていますが 0x1b の間違いです。また、「機能」のカラムで目的語を「C0の」「C1の」と書いていますが、これらはすべて「G0の」「G1の」が正解です。以上を踏まえて書くとこうなります。

(誤った表)(現状)

略号意味ASCII コード16進値機能
LS0Locking Shift ZeroSI0x0fC0のGLへのロッキングシフト
LS1Locking Shift OneSO0x0eC1のGLへのロッキングシフト
LS2Locking Shift TwoESC n0x1b 0x6eC2のGLへのロッキングシフト
LS3Locking Shift ThreeESC o0x1b 0x6fC3のGLへのロッキングシフト
LS1RLocking Shift One RightESC ~ESC 0x7eC1のGRへのロッキングシフト
LS2RLocking Shift Two RightESC }ESC 0x7dC2のGRへのロッキングシフト
LS3RLocking Shift Three RightESC |ESC 0x7cC3のGRへのロッキングシフト
SS2Single Shift 2SS20x8eC2のシングルシフト
SS3Single Shift 3SS30x8fC3のシングルシフト

(正しい表)(本来)

略号意味ASCII コード16進値機能
LS0Locking Shift ZeroSI0x0fG0のGLへのロッキングシフト
LS1Locking Shift OneSO0x0eG1のGLへのロッキングシフト
LS2Locking Shift TwoESC n0x1b 0x6eG2のGLへのロッキングシフト
LS3Locking Shift ThreeESC o0x1b 0x6fG3のGLへのロッキングシフト
LS1RLocking Shift One RightESC ~0x1b 0x7eG1のGRへのロッキングシフト
LS2RLocking Shift Two RightESC }0x1b 0x7dG2のGRへのロッキングシフト
LS3RLocking Shift Three RightESC |0x1b 0x7cG3のGRへのロッキングシフト
SS2Single Shift 2SS20x8eG2のシングルシフト
SS3Single Shift 3SS30x8fG3のシングルシフト

© 2003 Chihiro Fukazawa, all rights reserved.

Valid HTML 4.01!