文字コード

7月11日、「マイナビニュース」配信のYhoo! ニュースに、「もはや人ごとでは済まされない! 外字/異体字が抱える問題とは?」があります。文字数は1441文字。

 

日常的に最も使用頻度の高い文字は、「JIS第一水準」に定められており、2965文字あります。「JIS第二水準」は3390文字。他にも、第三水準、第四水準、補助漢字、非漢字などがあります。丸付き数字などは非漢字に入ります。

誰でも一度は聞いたことがある「JIS」の正式名称は「日本工業規格」。

文字も規格で、JISの分類「その他」に含まれています。

 

タイトルにある外字とは、JIS規格に含まれない文字、あるいは常用漢字に含まれない文字のことです。

異体字とは、たとえば「斎藤さん」の、「齋」などの文字のように読み方や意味は同じで、形が違うものです。

インターネットサービスが普及したことにより問題の1つとなっているのは、様々なシステム環境で共通に見ることのできない文字があるということです。これをIVS (Ideographic Variation Sequence)———つまり、基本の文字形とバリエーション(異体字)の番号を組み合わせて、世界標準の文字コードの規格「Unicode」で表現することで、解決できるのだそうです。

 

ワープロ(ワードプロセッサー)と呼ばれる文章入力のコンピューターが出始めた頃には、JIS第一水準の漢字しか搭載されておらず、JIS第二水準は、オプションで増設しなければなりませんでした。

今では、コンピューターに文字が最初から搭載されていますので、手描き入力ソフトで簡単に変換できるようになりましたが、その前までは、変換しても出てこない漢字は、文字コードを入力していました。詳しくいうと、「亜」は漢字コード表の「30」と「21」なので、「3021」と入力するのです。

コードを見つけるためには、コード表が必須でしたが、それを思うと、とても便利になりました。

 

話が変わりますが、ある作家は、どこに行く時も、愛用の辞書を離さなかったそうです。後で分かったことですが、その辞書には、自分で紡いだ言葉がたくさん書き込まれていました。

パソコンの辞書機能にも追加登録することができますが、実際には、使いこなせていないのが現実です…

このページの先頭へ