文字コード【超】研究
参考ページへのリンク


RFC について

JPNIC が紹介している RFC の翻訳のページ(本書では p.228 で紹介)
RFC はインターネット上のさまざまな合意を規定した技術文書です。 本来は英語で書かれていますが、このリンクで日本語版が公開されています。 また RFC 自体についての解説も載っていますので、ぜひご一読をおすすめします。

JIS X 0213 について

「青空文庫」のJIS X 0213 の使用/表示についての紹介ページ(本書では p.371 で紹介)
青空文庫は版権が切れた文学作品をネット上に蓄積しようというプロジェクトで、 旧字体が豊富でフォントを入れ替えれば容易に使用できる Shift_JISX0213 の活用を提案しています。 上のページでは Windows パソコンでの JIS X 0213 の活用法が詳しく解説されています。
もりみつじゅんじさんの JIS X 0213 コード表(同じく p.371 で紹介)
もりみつじゅんじさんの作成された JIS X 0213 のオンラインコード表です。
内田明さん作のフリーフォント、拡張ワタナベワダケンフォント(同じく p.371 で紹介)
Shift_JISX0213 対応の美しいアウトラインフォントです。
追記:なお、拡張ワタナベワダケンフォントは、その後ルーツとなった 32 ドットフォントが、既存商品の複製である疑いが濃厚となったため、配布を中止されています。ことの経緯が上記のサイトおよびリンクされているサイトに詳述されています。なお、代わりに使えるフリーフォントが下のサイトで公開されました。
内田明さんのサイト補完癖抄(上記の件に関連して)
おことわり:本サイトはここまでのサイトと異なり、本書(第1版第1、2刷)では紹介されていませんが、上記の件を補完するためにここに紹介します。
上記のように、フリーフォントとして配布可能だった Shift_JISX0213 対応のフォント拡張ワタナベワダケンフォントは配布が中止されています。
しかしその後、日立製作所と内田明さんの間で合意が成立し、Shift_JISX0213 対応のフリーフォントXANO 明朝およびQANO 明朝が公開される運びとなりました。
本書の Shift_JISX0213の実験を行う場合は、このフォントを使ってください。
イオさんのサイト「文字コードについて」(同じく p.371 で紹介)
Windows 2000 / NT / XP では単純にフォントをインストールするだけでは Shift_JISX0213 が使えません。このページではシステムに手動でパッチを当てて上記のフォントを使えるようにする方法が書かれています。あくまで自己責任での適用をお願いします。
追記:その後、本サイトは閉鎖されましたが、後述するサイトでも同様のパッチ法がかかれています。
斉藤寿成さんのサイト「慈寿恵久寿零弐壱参布教堂」(上記の件に関連して)
上記の通り、現在は閉鎖されているイオさんのサイトに代わって、Windows 2000 / NT / XP で Shift_JISX0213 を使うパッチ方法が書かれています。これも自己責任で適用してください。
なお、下図は上記の XANO 明朝および斉藤寿成さんの公開されているパッチを使って、Shift_JISX0213の動作確認を行ったものです。
付記(2004/06/24):斉藤寿成さんご本人からリンク先の変更をお知らせいただきました。ありがとうございます。なお、斉藤寿成さんの苗字を「斎藤」と間違って書いていたこともご指摘いただきました。斉と斎は異体字でもなく別字だそうです(^^)。お詫び申し上げます。

Unicode について(本書では p.478 以降で紹介)

UnicodeData.txt
UCD と言われます。Unicode 文字の一覧表です。 ただし例示字形は含まれていません。また、漢字 / ハングルは含まれていません。
UCD.html
上記のUCD のプロパティを解説しています。
Unicode Character Name Index
文字名で検索できる HTML 版のコード表で、例示字形も入っています。
Unihan.txt | 圧縮版
漢字のデータが含まれています。ただし、例示字形は含まれていません。
Unihan Database
漢字を検索できます。HTML で、例示字形も入っています。 なお、文字コードから検索するには Grid Index が便利です。
Block.txt
Unicode のブロックがまとめられています。

ここからは Unicode と従来の文字コードのマッピングを示します。

JIS0201.TXT
JIS0201.TXT は JIS X 0201 と Unicode スカラー値のマッピングを示しています。 Unicode コンソーシアム的には OBSOLATE(廃要素)になっています。
JIS0208.TXT
これは JIS X 0208 と Unicode スカラー値のマッピングを示しています。 やはり OBSOLATE(廃要素)です。
JIS0212.TXT
これは JIS X 0212 と Unicode スカラー値のマッピングを示しています。 やはり OBSOLATE(廃要素)です。
なお、このデータを元に文字コードを埋め込んだコード表を本書ではスクリプトで生成しています。 文字コード表のページのmy_jisx0212_unicode_table.txtです。 (UTF16-BE-BOM の Unicode です。)
SHIFTJIS.TXT
これは Shift_JIS と Unicode スカラー値のマッピングを示しています。 やはり OBSOLATE(廃要素)です。 このデータに載っている対応関係はいろいろ問題があります。 Windows や Macintosh の文字コードは Shift_JIS を元にしながら微妙に非互換があるからです。
CP932.TXT
これは Windows が拡張した Shift_JIS である CP932 と Unicode スカラー値のマッピングを示しています。 SHIFTJIS.TXT とは微妙に互換性がありません。(本書 p.511 参照)
シフトJISからUnicodeへの変換テーブルの相違
『パソコンによる日本語処理/文字コードハンドブック』(技術評論社刊)の著者、川俣晶さんによる、 Shift_JIS 派生の各ベンダーコードから Unicode への変換の非互換を研究したページです。

その他

WEFT
Internet Explorer 限定の外字フォントを送信する技術 WEFT の紹介ページ。
今昔文字鏡(こんじゃくもじきょう)
大文字(だいもじ)セットのひとつ、今昔文字鏡の紹介サイトです。 未登録文字の無償登録や、収録文字の画像を URL で供給するフォントサーバーなどを提供しています。
e漢字(いーかんじ)
やはり大文字セットのひとつです。
GT明朝「ゆたかな文字文化を創りあげるために」
やはり大文字セットのひとつです。現状では Shift_JIS のフォント切り替えによって実装されています。 本書の21章では GT 明朝の使い方がやや詳しく紹介されています。
実体参照の一覧(W3C の HTML 4.01 仕様書)
HTML 実体参照の一覧の原典版です。
筆者のしょうもない Web ページ
本書の筆者深沢千尋の雑文集、前著「すぐわかる Perl」の紹介および正誤表 ;;;、あと東横線踏破記録(写真つき)などが書かれています。だらだらした気分のときに見たりするといいんじゃないでしょうか。

© 2003 Chihiro Fukazawa, all rights reserved.

Valid HTML 4.01!