(株)ラトルズ刊『文字コード【超】研究 改訂第2版』公式サポートページ まえがき

まえがき

文字コードという妖怪が、ネットワーク上を歩き回っています。それは各家庭のパソコンに現れ、時として文字どおり化けては人びとを驚かせています。

なぜ最近急にこういうことになったんでしょうか。ひとつはインターネットの普及でさまざまな国のさまざまな機種のコンピューターがデータを交換することになったこと。ひとつは Linuxの勃興や Macintoshの復活、そして携帯端末の跋扈によって、数多くのプラットフォームが再びしのぎをけずることになったこと。そしてまったく新しい文字コード Unicodeの到来。こういったことが折り重なって、文字コードというものの理解と問題への対策が、いまほど求められているときはないかもしれません。

本書はこれらの問題について、類書とはちょっと違うアプローチを試みてみました。箇条書きにすると

●原理主義 宗教用語ではなくて、なんでも原理から説き起こす、原理にさかのぼって考える態度のことです。本書のような規格や技術についての本は古くなるのが早いですが、原理を押さえておけばたとえ規格が改訂されても対処するのはたやすいはず。

●実験主義 原理主義に含まれますが、なんでも実験する、自分の目で確認する方法論のことです。本書ではWindowsに付属のソフトウェアと、PerlをはじめWindowsで動作するフリーウェアだけを使って、文字コードのさまざまな実験を行っています。なにかあったらちょっと実験という姿勢があれば、本を読んでいて疑問に感じたことや、書いていないことも、さらに研究を広げることができます。

●Perl主義 実験主義に含まれますが、本書はスクリプト言語Perlによるサンプルプログラムを数多く含んでいます。中には純粋に実験のためのものもありますが、実際に役立つ(筆者自身が役立てている)ユーティリティも少なくありません。いろんなスクリプトを調子に乗って書いていたら、あたかも本書がPerlの入門書のようになってしまいました。
特にぼくの前著『すぐわかるPerl』を買って、あまりにもUNIX主義なので困っているWindowsユーザーの方は(すいません当時はPerlと言えばUNIXと思ってたんです…)本書でWindowsでのPerlの動かし方や問題を学べると思います。

●実際主義 本書はあまりバランスがよくありません。あるトピックは異常に細かく書いていますが、あるトピックはあっさり通り過ぎています。これは筆者が本業である技術翻訳の作業の過程で、特に問題になった現象や陥りやすい誤解に紙数を割いて書いているからです。もうあまり省みられない規格や、理論上の美しさのためにのみ書くべき内容は思い切って割愛し、特に実作業で問題になるトピックに注力しています。

ということで、文字コードで困っている人、Perlで面白い実験がしたい人、コンピューター力を付けてステップアップしたい方は、ぜひお読みください。たかが文字とも思いますが、人間が物事を言葉で考えるように、コンピューターが扱う情報はマルチメディア時代になってもほとんどが文字と言っても過言ではありません。文字をいじって、転がして遊んでいるうちに、コンピューターそのものの原理の一端にさえ触れることができると思います。

では本文でお会いしましょう。



■2011年版へのまえがき

本書の初版を2003年に上梓してからもう8年の月日が経ちました。類書があまりないこともあって、おかげさまでおおむね好評を博し、細々ながら着実に増刷を重ねて、このたび第2版を上梓できることは望外の喜びです。ご愛読ありがとうございます。

2003年版の「まえがき」に書いたように、初版の時から可能な限り古くならない本を書くように努力したつもりです。しかしながら、7年も経つとさすがにそれも限界があります。

思えばこの7年の間に、元モーニング娘。の辻希美さんが結婚/出産してカリスマ主婦になられたのも予想外でしたが、その「辻」という字がWindowsパソコン上で一点之繞から二点之繞に変わったのも驚きました。もしかするとみなさん、お使いのWindowsパソコンで「辻」という字が二点之繞に変わっていたのをご存知ない、気づかないで使っている方もいらっしゃるのではないでしょうか。急いで確認してください。

また、旧版では「小説家、内田百閧フケンと言う字は日本語の文字セットには含まれていないので簡単に出ない。台湾の繁体字中国語には入っているので、Webページを制作する場合はこれを文字参照で使えば出せる」などと書いていました。しかしながら現在、うちだひゃっけんと入力して変換されれば、あっさり内田百という文字が出て普通に保存できると思います。


図:Windows Vista以降では「辻」、「閨v、「叱」という時はこのように表示される

これらは、JIS X 0213:2004がリリースされ、Microsoftが2006年にWindows Vistaでそれに対応したことによって起こった現象です。詳しくは新版の14章をご覧ください。

また、Unicodeについての記述は6.0に改めました。最初は「黒船」「米国グローバリズムによる日本語文化の破壊」などと喧伝されたUnicodeでしたが、付き合ってみると意外といいやつで、すっかり文字コードの中核として定着しました。もちろん世界統一規格である以上どの国の国民にも不満は出てきますが、その不満を述べる機会も用意されています。我々日本人にとっては上述のように繁体字中国語の旧字体が使えることもあって、かえって使える字が増えました。今後も、Unicodeが文字コードの中心となっていくことに疑いはないでしょう。その点を踏まえ、本書でもUnicodeについての記述を増補しました。

また、携帯電話の絵文字についても記載しました。現状では各キャリアがバラバラのコードを使っているのですが、2008年にGoogleが統一コードをUnicodeの一部として策定しました。これもUnicodeの襲来に続くプッチ黒船というか、またしても米国企業の提唱するグローバル・スタンダードによって日本独自の文化がリファインされてしまった形です。くやしい気もしますが、この点についても19章で研究していますので、どうぞお読みください。

その他、この7年でぼく自身も多少は知見が増え、自分としては文章力も向上したように思えて仕方ないので、全体に渡って文章や例題プログラムに改訂を施しました。うまく行っているといいのですが・・・。とりあえず本文をお読みください。

©2011 Chihiro Fukazawa. All rights reserved.

文字コード超研究,文字コード「超」研究,文字コード【超】研究,Unicode,JIS X 0213,Perl,エンコード,深沢千尋,内容紹介,サンプルデータ,サンプルコード,文字コード表,参考ページ,ラトルズ,フリーウェア,正誤表,おことわり,すぐわかるPerl,すぐわかるオブジェクト指向Perl,文字コード超研究,文字コード「超」研究,文字コード【超】研究,Unicode,JIS X 0213,Perl,エンコード,深沢千尋,内容紹介,サンプルデータ,サンプルコード,文字コード表,参考ページ,ラトルズ,フリーウェア,正誤表,おことわり,すぐわかるPerl,すぐわかるオブジェクト指向Perl



『文字コード【超】研究 改訂第2版』

深沢千尋■著
(株)ラトルズ■刊
B5変形版■664ページ
定価■3654円(税込)
ISBN■978-4-89977-293-4
☆ メニュー
☆ 目次
★ まえがき
☆ サンプルデータ
☆ サンプルコード
☆ コード表
☆ 正誤表
☆ おたよりコーナー
☆ リンク
☆ 深沢千尋サポートページ(トップ)に戻る

最新情報

2011-07-19 本サイトを公開