Home
Up


????Date:
...???????:-)
????Stock:
...????????

[ Home > Computing > Character ]

Character (11/26/98)

「文字列」の話題です。

コンピュータにとって、文字列(character, string)というデータの型は、整数値(integer)の次に基本となるデータの型です。数字というのは、機械にとっては大変都合の良いデータ表現方法ですが、人間にはちと。。。桁が5桁以上くらいになるとよく理解できなくなりますし:-)、やっぱり、文字、文章でその感想とか、印象とか、判断とか、そういった情報(データ)を入出力しないとピンときません。

日本語の国に産まれた日本人は、このコンピュータ社会にあっては、なんて不幸なんだろう、とずっと思っていました。コンピュータと付き合うにあたって、アルファベットと記号の世界で生きる欧米人に対して、ひらがな、かたかな、4000文字以上もある漢字をハンドリングするハンディキャップ。。。しかし、アメリカに来て、英語で生活するようになって、かえって日本人、いや、漢字のアドバンテージというのも感じるようになりました。。。

全角文字の悲劇

ひらがな、かたかな、漢字、記号、これらの文字のことを「全角文字」と呼びます。文字の幅がちょうどアルファベットの倍くらいあります。データ量も半角文字(アルファベット、記号)が 1byte=8bit であるのに対して、全角文字は基本的には 2byte=16bit です。日本語の文字コードは、(最近ではみなさん、もう聞き馴染んでいるでしょうか) 以下の3つに大きく分けられます。

  1. JISコード (JIS)
  2. SHIFT JISコード (SJIS)
  3. 拡張UNIXコード (EUC)

難しい技術的な話しはまぁ置いておくとして、悲劇はなんといっても、これら3種類の文字「だけ」扱うのなら問題ないのですが、これらに加えて、欧米と互換性のある、半角文字(ASCIIコード)を扱わねばならないことです。

たとえば、あるファイルの途中に「e」という文字を発見したとします。ASCIIコードで言えば、「17」(コード表が手元にないので値は嘘です^^;)だとします。果たして、この文字は何という文字でしょうか?

「e」なんだから当然「e」!その答えは、ASCII文字列の中で生きる欧米人にのみ許される答えです。:-p 全角文字を考慮にいれると、これが本当にアルファベットの「e」なのか、はたまた、全角文字の「表」の 1byte目 なのかは、実はこの 1byte の情報では決定不可能で、もう1文字読み込んでみないと決定できないのです。

我々全角文字民族は、コンピュータに関して、こんな本当に基礎の基礎の部分でハンディキャップを背負っているのです。

入力だって一苦労

漢字かな変換に馴れきった日本人にとって、「変換」の手間のない欧米人の入力の単純さが想像できるでしょうか? キーボードの上にはアルファベットが刻印されているのみ。そしてそれらを連続的にたたくだけで、もう文章の出来上がりです。WEBだって、ワープロだって、みーんなそれで済んじゃうのです。学校で、隣の学生が Microsoft Word 相手に、つらつらレポートを書いている様を見て、純粋に、「なんて単純なんだろう。。。」と感動してしまいました。

そう言えば、昔仕事でインドのソフトベンダーにいったとき、

「漢字はどうやって入力するのか?」

と聞いてこられて困ってしまいました。

「発音をね、こうやって、えーと、母音と子音というのがあって、それらはアルファベットで表現できるから、。。。」

彼らにはちんぷんかんぷんです。:-)

漢字はアイコンだ!

昔、学生のころDTPを目指したワープロを作ったことがあります。今のWindowsのようなコンセプトで、メニューにアイコン(Windowsのアイデア自体は60年代ころにすでに Xerox社のJstarにその具現化が始まっています。なにも新しいアイデアではありません)。しかし、当時画面の大きさが今ほど大きくなかったので、そのアイコンやメニューの配置にえらく苦労したものです。

小さい領域である特定の概念を表現したいんです。たとえば「編集ボタン」。「印刷ボタン」。Macをお手本にすれば、センスのいいアイコンを作るというのが正解でした。「Edit」や「Print」と表現するよりははるかに場所の節約になります。しかし、我々にはもう一つ良い方法がありました。それが「漢字」です。

漢字というのは、たった一文字で「意味」を持ちます。「編集」の「編」と書いただけで、「Edit」と書くのとほぼ同等の情報を伝達することができます。2byte 対 4byte で漢字の勝ち!:-) アイコンというのは簡単なようで実はものすごく難しく、Apple社ほどセンスのよいデザイナーがいない限り、こちらの漢字を使う方法の方が我々にとっては、簡単で分かりやすそうです。

逆に言うと、漢字という意味をもった文字をもたない欧米人だからこそ、小さい領域で意味を表現できるアイコンが必要だったといえるかもしれません。

アメリカにきて、漢字で名前を書くことに数回出食わしています。中国人や、韓国人が名前を漢字で書けというのです:-) そう、漢字は中国から渡ってきた、アジアでは非常に互換性の高い媒体です。そういえば、中国に旅行にいったときも、会話は全然出来ませんでしたが、「筆談」ならなんとか意味が通じた覚えがあります。^^;

書き英語、しゃべり英語

アメリカで生活するようになって、一つ勇気づけられるのは、「英語」これはなにも難しい文学調、文法、、、云々ばかりではなく、それ以外のくだけた英語の世界が結構広いということです。

日常しゃべっている言葉だって、文章というより、単語をならべただけ。のような場面に出くわすことが多いですし、広告やテレビ。なんだ、英語の文章なんてちゃんと書けなくても何とかなるじゃん。。。(いえ、学校の宿題とかレポートはさすがにそうはいかないんですがね^^;)

聞けば、アメリカ人も「文章を書く」というのは、日本人以上に苦手の模様。まぁ、日本人だって、企業の中で、説得力ある文献を。といわれれば相当難しいですが、それでも、やっぱり、アメリカ人の方が比較的「文章」自体に馴染みがなさそうです。

最たるものは、オンライン chat ! こちらの地元の chat のサイトにアクセスしてみたのですが、そこでやり取りされている英語というのは、もう、あの、渋谷の女子高生のしゃべり言葉を始めて聞いたときと似たショックでした。:-) 略しまくり、単語のみ。文章なんて程遠い。そんな印象です。

ログオンすると、いきなり 「a/s/l ?」 と書き込まれました。「!?$&^@%」という感じです。聞けば、「age/sex/location」 のことだといいます。(名前は、システム側でニックネームが表示されるので聞かなくても良いわけです。) とまぁ、こんな調子です。

ネット社会での言語

コンピュータとネットワーク。これからもどんどん発達していくでしょう。人と人がネットワークという媒体で繋がり、そこに社会が形成、いや、今の社会そのものがネット社会へと移行しつつあるわけです。電話でしゃべる、Face to Face でしゃべる、新聞用語、専門雑誌用語、それぞれの媒体にカスタマイズされた「言語」があるように、ネットワークにはネットワーク用の言語が産まれると予想しています。

今、インターネットは英語に席捲されていますが、今後アジア諸国の経済が発達するにしたがって、英語以外のインターネット言語が産まれてもよいように思います。特に「漢字」、雑誌や、新聞と違ったインタラクティブなネット社会の「アイコン」としては、大きな可能性があります。中国人に理解できる!これだけで、世界の4分の1のマーケット(人口)にアプローチできるわけですから。。。

#あ、ひらがな、かたかなに将来はありません。日本人しかわかりませんから:-p

 

[ Top ]


If you have any questions or comments, please send an E-mail message to hirosi@hirosi.com .
Last Updated:11/24/01