2010/06/27

コード化って処理を合理化するんだよね?

「文字コード技術入門」等の資料を読むにつれ、漢字コードの怪しさに往生感を抱きました。
コード化は、システムを見える化するためのもの.....だったよね。
データにコードをつけるのは、一元化したり、グループ化したり、特性区分けしたりして、システム上扱いやすい代名詞化することです。
上記の本や、漢字をコード化するときの紆余屈折というか、苦悩が伺えます。
JIS X 201-xxxx(年) JIS X 0208-xxxx(年),,第一水準、第二水準、補助漢字、第三水準、第四水準....
ここまでは、コードの意味で理解できました。でも、漢字表、漢字字体表、関係で異字体を包摂とする字、別コードを割り振る字があったり、
もう、基準がワケワカの世界。一度決めた字コードを途中で入れ替えるなんてコード化の意味を無くす行為に見えます。
 電子データは将来に渡って復元できるのがメリットなのに、いまの体系だと、電子データを作った時の、漢字コードを把握しておかないと、復元できない。
所轄官庁が、文部省、通産省、法務省(地名、人名関係) に跨っているのも影響しているのかもしれませんが腑に落ちない。
CJK統合漢字の異字体セレクタを導入したのなら、包摂関係をやめて、異字体登録すれば、スッキリすると思うのですがね。
対処療法でコード化したようで、他のコード体系に変換すると不可逆モードに陥るのは理屈は判るがコード体系として納得ができない。
開発者が右往左往している現状をみると、「だれの為のコード化なんだ」とボヤキたくなりますね。

0 件のコメント:

コメントを投稿