文字コード【超】研究
まえがき


文字コードという妖怪が、ネットワーク上を歩き回っています。それは各家庭のパソコンに現れ、時として文字どおり化けては人びとを驚かせています。

なぜ最近急にこういうことになったんでしょうか。ひとつはインターネットの普及でさまざまな国のさまざまな機種のコンピューターがデータを交換することになったこと。ひとつは Linux の勃興や Macintosh の復活、そして携帯端末の跋扈によって、数多くのプラットフォームが再びしのぎをけずることになったこと。そしてまったく新しい文字コード Unicode の到来。こういったことが折り重なって、文字コードというものの理解と問題への対策が、今ほど求められている時はないかもしれません。

本書はこれらの問題について、類書とはちょっと違うアプローチを試みてみました。箇条書きにすると

●原理主義

宗教用語ではなくて、なんでも原理から説き起こす、原理にさかのぼって考える態度のことです。本書のような規格や技術についての本は古くなるのが早いですが、原理を押さえておけばたとえ規格が改訂されても対処するのはたやすいはず。

●実験主義

原理主義に含まれますが、なんでも実験する、自分の目で確認する方法論のことです。本書ではWindowsに付属のソフトウェアと、PerlをはじめWindowsで動作するフリーウェアだけを使って、 文字コードのさまざまな実験を行っています。何かあったらちょっと実験という姿勢があれば、本を読んでいて疑問に感じたことや、書いていないことも、さらに研究を広げることができます。

●Perl主義

実験主義に含まれますが、本書はスクリプト言語Perlによるサンプルプログラムを数多く含んでいます。中には純粋に実験のためのものもありますが、実際に役立つ(筆者自身が役立てている)ユーティリティも少なくありません。いろんなスクリプトを調子に乗って書いていたら、あたかも本書がPerlの入門書のようになってしまいました。

特にぼくの前著「すぐわかるPerl」を買って、あまりにもUNIX主義なので困っているWindowsユーザーの方は(すいません当時はPerlといえばUNIXと思ってたんです・・・)本書でWindowsでのPerlの動かし方や問題を学べると思います。

●実際主義

本書はあまりバランスがよくありません。あるトピックは異常に細かく書いていますが、あるトピックは あっさり通り過ぎています。これは筆者が本業である技術翻訳の作業の過程で、特に問題になった現象や陥りやすい誤解に紙数を割いて書いているからです。もうあまり省みられない規格や、理論上の美しさのために書く内容は思い切って割愛し、特に実作業で問題になるトピックに注力しています。

ということで、文字コードで困っている人、Perlで面白い実験がしたい人、コンピューター力をつけてステップアップしたい方は、ぜひお読みください。たかが文字とも思いますが、人間が物事を言葉で考えるように、コンピューターが扱う情報はマルチメディア時代になってもほとんどが文字といっても過言ではありません。文字をいじって、転がして遊んでいるうちに、コンピューターそのものの原理の一端にさえ触れることができると思います。

では本文でお会いしましょう。


© 2003 Chihiro Fukazawa, all rights reserved.

Valid HTML 4.01!