本ページでは、株式会社ラトルズ刊「文字コード【超】研究」で刊行後に発見された誤りと訂正を載せています。 大変ご迷惑をおかけしますが、訂正をお願いします。 また、誤りとはいえないまでも、誤解をまねく表現の向上も行っています。 その場合アスタリスク(*) がついています。 なお、ご指摘いただいた方にこの場を借りてお礼申し上げます。
最終更新日:2004/08/13
以下は第1刷および第2刷の誤りです。(ちなみに、刷は「すり」と読みます。)
第2刷の誤りは第1刷から累積してますので、第1刷をお買い求めの方は下の第1刷と合わせてご参照ください。
起票日 | ページ | 箇所 | 現状 | 訂正後 |
---|---|---|---|---|
2004/06/24 | p.133 | 真ん中の下 | 16 進数の場合は 0 から f までの 15 個の数字を使います。1 | 16 進数の場合は 0 から f までの 16 個の数字を使います。1 |
2003/10/15 | p.251 | 見出し「ISOで使うもの」から4行目 | コード:0xb1 | コード:0x1b |
2003/10/15 | p.264 | COLUMN「チルダとオーバーライン内」(3箇所) | 0x8e | 0x7e |
2003/11/11 | p.276 | ページ下の表 | 0x0f => FF、0x0b => BS、0x0a => BEL | 0x0c => FF、0x08 => BS、0x07 => BEL |
2003/10/15 | p.282 | 下から6行目 | 0x5eがチルダ(〜)ではなくてオーバーライン( ̄)であること | 0x7eがチルダ(〜)ではなくて・・・ |
2003/10/25 | p.283 | 図9.1 | 左面(基底状態およびSIのあと)の5列C行がバックスラッシュ(\) | 円記号(¥)が正しい(JIS X 0201 だから) |
2003/10/25 | p.284 | 本文下から4行目 | Jがそのままハと表示されてしまっています。 | ハがそのままJと表示されてしまっています。 |
2003/10/31 | p.304 | 図10.1 右肩のキャプション | ASCIIは・・・固定するコード系であ | ASCIIは・・・固定するコード系である。 |
2003/10/25 | p.305 | 1行目(図10.2の下) | 両方とも0x21〜0xfeを使うとすると | 両方とも0x21〜0x7eを使うとすると |
2003/10/25 | p.322 | 11.1「ISO 8859-1文字コード表」本文1行目 | ・・・0x80〜0x1fはC1制御文字です。 | ・・・0x80〜0x9fはC1制御文字です。 |
2003/10/25 | p.322 | 11.1「ISO 8859-1文字コード表」本文1行目 | ・・・残りのGL(0xa0〜0xff)にラテン文字1と呼ばれる | ・・・残りのGR(0xa0〜0xff)にラテン文字1と呼ばれる |
2003/10/25 | p.338 | 本文下から3行目 | 第1バイトを区(ward) | 第1バイトを区(row) |
2004/08/13 | p.406 | 本文上から5行目 | 「Shift_JIS は非モード式で・・・」以降全体 | おたよりコーナー 2 に改訂版を掲載 |
2003/10/30 | p.410 | 本文中ほど | もう一つ、図17.4のような実験をしてみます。 | もう一つ実験をしてみます。「表示」「侮ヲ」と書いたファイルを作ってダンプしてみましょう。 |
2003/10/25 | p.428 | 本文2段落目 | 図4はwincode1.bmpをxyzzyで表示・・・ | 図4はwincode1.txtをxyzzyで表示・・・ |
2004/08/13 | p.471 | 表 | 訂正前 | 訂正後 |
2004/08/13 | p.461 | 図の下 | (右のメモを挿入します) | (メモ)Unicode Consortium は UTF-16 の使用を推進しており、UTF-16 収録可能範囲の UCS-4 0 群 16 面までの収録しか許さないだろうとのことです。 |
2004/08/13 | p.471 | 末尾 | (右のメモを挿入する) | UTF-8 で 4 バイトに入るまでのコード範囲は、サロゲートペアを含む UTF-16 で表現できるコード範囲に相当します。Unicode Consortium は UTF-16 の使用を推進し、UTF-16 の範囲に入らない文字を許さないだろうということなので、UTF-8 も将来に渡って 4 バイトと考えられます。 |
2004/08/13 | p.476 | 箇条書きの 2 つめ | UTF-32 には BE と LE がある。UCS-4 の 0xAAAABBBB という字を BE で表現すると U+AAAABBBB のままになるが、LE で表現すると 16 ビットごとに反転して U+BBBBAAAA になる。ワード(16 ビット)単位で反転するので注意 | UTF-32 には BE と LE がある。UCS-4 の 0xAABBCCDD という字を BE で表現すると 0xAABBCCDD のままになるが、LE で表現すると 8 ビットごとに反転したものがさらに 16 ビットごとに反転して U+DDCCBBAA になる。 |
2004/08/13 | p.504 | 末尾メモ | ここまでが UTF-8 では 3 バイトの文字です。また、ここまでが UTF-16 で 2 バイトの文字です。(以降はサロゲートペアを使って表現します。) | ここまでが UTF-8 では 3 バイトの文字です。また、ここまでが UTF-16 で 2 バイトの文字です。(以降はサロゲートペアを使って表現します。)なお、これ以降の文字はすべて UTF-8 で 4 バイトで表現されます。UTF-8 で 5 バイト以上の文字は、当面は存在しません。 |
2004/08/13 | p.505 | 下の方のメモ | ここまでが UTF-8 では 4 バイトの文字です。これ以降はすべて 5 バイトで表現されます。ぼくが生きているうちに UTF-8 で 6 バイトが必要な字は現れないと思います。 | 左のメモを削除します。(5 バイトの UTF-8 は存在しません。くわしくはおたよりコーナー2を参照してください。 |
2003/11/10 | p.601 | バッチファイルの中 | go to endofperl | goto endofperl |
以下は第1刷の誤りで第2刷で修正されたものです。
起票日 | ページ | 箇所 | 現状 | 訂正後 |
---|---|---|---|---|
2003/07/26 | p.24 | 中へん | で、慣習的にこの左のゼロも読みます。(*) | で、慣習的に補ったゼロも読みます。 |
2003/7/26 | p.30 | 真ん中下のメモ | コード表でこれらの字が「CR(0x0d)」「LF(0x0d)」と…… | ……「CR(0x0d)」「LF(0x0a)」と…… |
2003/07/26 | p.58 | 真ん中上へん | さっきと変わりませんね。(*) | さっきと変わりませんね。(厳密にはコメントを変えていますが…) |
2003/08/04 | p.63 | 前半のメモ | …改行や空白はこのプログラムを使って研究できません。(*) | …改行や空白はこのプログラムを使って研究できません。(ただし、引数全体を二重引用符 " " で囲めば空白は渡すことができます。) |
2003/07/26 | p.64 | 下の実験入力 | 起動しているプログラムが str2hex.pl | hex2str.pl |
2003/07/26 | p.65 | 冒頭、プログラム名見出し | str2hex.pl | hex2str.pl |
2003/07/26 | p.65 | 冒頭、プログラム名注釈 | str2hex.pl -- 文字列を入力してコード値を表示する | hex2str.pl -- 16 進数を入力して文字列を表示する |
2003/08/03 | p.93 | 下から2段落目 | ここでの電子回路の処理を D/A 変換(Digital/Analog conversion)… | ここでの電子回路の処理を A/D 変換(Analog/Digital conversion)… |
2003/08/03 | p.94 | 上から2段落目 | この処理を A/D 変換と言います。 | この処理を D/A 変換と言います。 |
2003/07/26 | p.107 | 図4.9 | (本体はエンターテインメント) | (本来は…) |
2003/07/26 | p.112 | 本文中ほど(他にもあり) | (「タチザキ」は立+奇と説明している) | (注1:タチザキについてを参照) |
2003/09/05 | p.139 | 一番下のメモ | CやPerlでべき乗を計算するには・・・ | Perlでべき乗を計算するには・・・ |
2003/07/26 | p.196 | 上の実験入力 | hex2dec.pl 1b2b3c | hex2dec.pl 1a2b3c |
2003/07/26 | p.202 | 下半分の実験入力 | hex2dec.pl 11011011 | bin2dec.pl 11011011 |
2003/08/18 | p.204 | 本文中段 | これは、hex2bin.pl を改造すればすぐできます。 | これは、hex2dec.pl を改造すればすぐできます。 |
2003/08/18 | p.204 | 本文中段 | では hex2bin.pl を改造した答えです。 | では hex2dec.pl を改造した答えです。 |
2003/08/10 | p.264 | コラム「チルダとオーバーライン」1行目 | ・・・〜のように天地中央どりにしていますか。フォントでは・・・ | ・・・〜のように天地中央どりにしていますが、フォントは・・・ |
2003/08/18 | p.309 | 下表、機能の欄 | 「C0のロッキングシフト」「C2のシングルシフト」など | 「G0のロッキングシフト」「G2のシングルシフト」など |
2003/08/18 | p.312 | 本文下段 | GR は Graphic Left という意味で | GR は Graphic Right という意味で |
2003/08/18 | p.313 | 下表 | 16 進値の ESC は 0x1b の誤記、機能の C0〜C3 は G0〜G3 の誤記 | 注2:ISO 2022 8ビット系の制御文字表を参照 |
2003/08/18 | p.315 | 2行目/3行目 | GLおよびGLに呼び出し | GLおよびGRに呼び出し |
2003/08/18 | p.318 | 下から7行目 | JIS X 0212をG0に指示する場合は「ESC $ ( D」、G1 に指示する場合は「ESC $ ( D」 | ・・・G1 に指示する場合は「ESC $ ) D」 |
2003/08/18 | p.318 | 下から6行目 | さて、そろそろ読むのも飽きてきたと思いますがが、 | さて、そろそろ読むのも飽きてきたと思いますが、 |
2003/08/08 | p.328 | 図11.5の3行目「ラテン文字3」のISO 2022終端文字 | B(0x42) | C(0x43) |
2003/08/24 | p.333 | メモ | gates.el | Gates.l |
2003/08/24 | p.336 | 本文2行目 | 1978年に日本で制定されたJIS X 0201 | 1978年に日本で制定されたJIS X 0208 |
2003/08/11 | p.347 | 中へん | これを包摂基準といいます。 | これを包摂規準といいます。 |
2003/07/26 | p.436〜437 | 図10、11の実験入力 | sjis_analyse_kanji.pl sjis2.pl | sjis_kanji_analyse.pl sjis2.pl |
2003/09/05 | p.465 | 図19.6 | (U+20009を丸で囲んでいる) | (U+2000Bを囲むべき) |
2003/08/08 | p.476 | 最終行 | …BE の BOM は 0x0000FFFE、LE の BOM は 0xFFFE0000 | …BE の BOM は 0x0000FEFF、LE の BOM は 0xFFFE0000 |
2003/08/24 | p.479 | 「字母」のふりがな | チョモ | チャモ |
2003/09/05 | p.490 | 下から2行目 | 問題は、中国と日本で韓国で同じ漢字とみなされる字の字形が、 | 中国と日本と韓国で同じ漢字とみなされる字の字形が、 |
2003/08/08 | p.492 | コラム本文最終行 | (シノ)はJIS X 0213で面区点番号2-13-41に収録されました。 | (シノ)はJIS X 0213で面区点番号2-83-41に収録されました。 |
2003/08/17 | p.498 | シンハラ文字の説明 | (マレーシアの公用語シンハラ語の文字) | (スリランカの公用語シンハラ語の文字) |
2003/08/24 | p.503 | 上の方 | Kiyoak A Mieum | Kiyeak A Mieum |
2003/08/24 | p.503 | 真ん中の段落1行目 | 10,733種類 | 11,172種類 |
2003/08/24 | p.503 | 中へん | Johab(チョハブ:組み合わせという意味) | Johab(チョハブ:「組合」という漢字のハングル読み) |
2003/07/26 | p.518 | 上の実験入力 | 出力結果が D840 DC0B | d840 dc0b(小文字) |
2003/07/28 | p.580 | 本文の4行目 | …ISO 8859-1 のファイルを quoted-pruintable で… | …ISO 8859-1 のファイルを quoted-printable で… |
2003/09/05 | p.594 | xyzzy の説明 | gates.pl | Gates.l |
2003/08/02 | p.607 | あとがきの献辞 | 技術評論者の | 技術評論社の(大変失礼しました…) |
異体字の例として、ツチヨシ、ハシゴダカと並んで3大人名漢字と呼ばれるタチザキを取り上げ、 初版1刷の p.112 などで多く書いていますが、この字の形を筆者は完全に勘違いしてい、 あろうことか存在しない字を作字して印刷してもらっています。
「崎」の異字体でタチザキと呼ばれるものがあります。 これは「崎」の山偏が「立」になったもの、 つまり です。
「崎」の異字体でタチザキと呼ばれるものがあります。 これは「崎」のつくりの上半分の「大」が「立」になったもの、 つまり です。
大変申し訳ありませんが、上記のようにご了解ください。
全体的に微妙に間違っています。
まず「16進値」のカラムの 4〜7 行目ですが、ESC と文字名で書かれていますが 0x1b の間違いです。また、「機能」のカラムで目的語を「C0の」「C1の」と書いていますが、これらはすべて「G0の」「G1の」が正解です。以上を踏まえて書くとこうなります。
略号 | 意味 | ASCII コード | 16進値 | 機能 |
---|---|---|---|---|
LS0 | Locking Shift Zero | SI | 0x0f | C0のGLへのロッキングシフト |
LS1 | Locking Shift One | SO | 0x0e | C1のGLへのロッキングシフト |
LS2 | Locking Shift Two | ESC n | 0x1b 0x6e | C2のGLへのロッキングシフト |
LS3 | Locking Shift Three | ESC o | 0x1b 0x6f | C3のGLへのロッキングシフト |
LS1R | Locking Shift One Right | ESC ~ | ESC 0x7e | C1のGRへのロッキングシフト |
LS2R | Locking Shift Two Right | ESC } | ESC 0x7d | C2のGRへのロッキングシフト |
LS3R | Locking Shift Three Right | ESC | | ESC 0x7c | C3のGRへのロッキングシフト |
SS2 | Single Shift 2 | SS2 | 0x8e | C2のシングルシフト |
SS3 | Single Shift 3 | SS3 | 0x8f | C3のシングルシフト |
略号 | 意味 | ASCII コード | 16進値 | 機能 |
---|---|---|---|---|
LS0 | Locking Shift Zero | SI | 0x0f | G0のGLへのロッキングシフト |
LS1 | Locking Shift One | SO | 0x0e | G1のGLへのロッキングシフト |
LS2 | Locking Shift Two | ESC n | 0x1b 0x6e | G2のGLへのロッキングシフト |
LS3 | Locking Shift Three | ESC o | 0x1b 0x6f | G3のGLへのロッキングシフト |
LS1R | Locking Shift One Right | ESC ~ | 0x1b 0x7e | G1のGRへのロッキングシフト |
LS2R | Locking Shift Two Right | ESC } | 0x1b 0x7d | G2のGRへのロッキングシフト |
LS3R | Locking Shift Three Right | ESC | | 0x1b 0x7c | G3のGRへのロッキングシフト |
SS2 | Single Shift 2 | SS2 | 0x8e | G2のシングルシフト |
SS3 | Single Shift 3 | SS3 | 0x8f | G3のシングルシフト |