バス 憧れの大地へ
        世界を目指しての旅行記ほか by カズ@憧れの大地 

雑記帳

WEBページで多言語同時表示 -1-

英語以外の外国関係のWEBを運営されている方なら、誰でもこんな悩みに直面したことがあることでしょう。

外国語の文字を含めることができない!

私も以前はそうでした。例えば、中国語の"你"という漢字が日本語のフォントに無いために、 [イ尓]などと書いていました。その他にも、新興都市として注目を集めている広東省・深圳を"深セン"と書いたり、文中では"●"と表記して最後に"注"として「●はくさかんむりに甫」などとしていました。

(以下中国語を例に書き進めていきます)

「WEB上で多言語を同時に表示できないか」というのは随分前から試みていました。その結果、まず思いついたのが、Wordで編集するという手法です。
Wordなら、日本語・中国語を混在させることができますし、「ファイル」→「Webページとして保存」とすればそれをWebページとすることもできます。
しかし、この方法には1つ大きな問題があります。 出来上がったページのサイズが、滅茶苦茶大きくなるのです。
確かに、Wordを使って作ったものは見栄えがいいです。しかし、日本語の漢字を使用した場合に比べ、 Wordを使ったものはサイズが10倍以上にもなってしまいます。
(こんなにでかくなるのでは駄目だ・・・)
見栄えがいいというメリットはあるのですが、これだけサイズの差が出ては話になりません。この方法は放棄することにしました。
(注:FrontPageには、Word特有の余分なタグを自動する機能があり、これを使えば約8kbまで減らすことができました)

その後暫く、日中混在ページ作成の試みからは遠ざかっていたのですが、 2003年、私はUnicodeというものの存在を知るに到りました。
Unicodeとは「すべての文字を16ビット(2バイト)で表現し、 1つの文字コード体系で多国語処理を可能にしようとするもの。世界の主要な言語のほとんどの文字を収録している」ものです。 (出典:「IT用語辞典 e-Words」 Unicode 【ユニコード】
ただし、このUnicodeは、Windowsでは2000、XP以降、MacOSではX以降のOSでしか対応しておらず、 Windows9xその他の旧来のOSでは確認していません。 (どなたかこれらのOSをお使いの方、情報をご提供下さい)

これを使えば、同一のページで多言語を混在させることができる――しかし、私が最初にたどり着いた手法は、文字そのものを入力するのではなく、各文字に割り振られたコードを1文字ずつ打ち込んでいくというものでした。 これは極めて効率の悪い手法なので、あえなく断念。

そんな中、仕事でWord(2000版使用)ドキュメントを翻訳する際、日→中の場合、表示を日本語のフォント(MS UIゴシックを除く)のままにして中国語を上書きすると文字化けが発生するのですが、逆に中→日の場合、表示を中国語のフォント"SimSun"のままにして日本語を上書きしても文字化けは発生せず、 SimSunのまま日本語が表示されることに気が付きました。 どうやら、 SimSunは日本語の漢字と仮名までカバーしているようなのです。 私のWEBページ作成の方式は、テキストエディタ(Windowsのメモ帳。その後、秀丸、EmEditorに乗り換え)にタグを手作業で打ち込んでいくものです。
多言語対応のテキストエディタなら、書式とフォントの設定で簡体字中国語のフォントを選択することができますので、ワープロを中国語←→日本語と切り替えつつ、エディタに文章とタグを打ち込んでいきます。
さて、いよいよそのHTMLファイルを保存、ということになりますが、保存する際には「文字コード」から「Unicode」或いは「UTF-8」を選択します。WEBでは通常「UTF-8」が使われています。 (「Unicode」と「UTF-8」の違いは何かと言うと、UTF-8はUnicodeの発展型で、より多くの文字をカバーしています。 ただし、本来2バイトである日本語の漢字かなを3-4バイトのデータに置き換えているため、 Unicodeよりは若干ファイルが大きくなりますが、HTMLではタグの部分に使用する1バイト文字(半角英数)の比率が高く、1バイト文字は1バイトのままであるため、そうびっくりする程大きくはなりません)

文字コードを変更して"保存"をクリックすると、今度は無事保存が完了します。後はブラウザで開いて、きちんと表示されているか確認してください。(私はMozilla1.7.1、Firefox2.0、Netscape Navigator7.1、Internet Explorer6.0で確認して、問題なく表示されました)
で、表示結果ですが、日本語の全角かなと中国語簡体字及び半角英数で表示フォントが違ってくる(半角英数はTimes New Romanになる)という、やや一体感の無いものとなってしまいますが、日中混在のWEBページを、という目的を達成できたので、取りあえずはよしとしましょう。 (注:Geckoエンジンでは、半角英数も日本語の全角かなと同じフォントで表示されるようです)

*        *        *

以上の方法で、日中両国語混在のWEBが作成できる訳ですが、タグを手作業で打ち込む作業に慣れていないと、最初の<html>からタグを打ち込んでいくのはなかなか大変です。そんな方は、中国語の部分を除いたページをまずHTML作成ソフトで作り、それから上記のように、テキストエディタに中国語を打ち込んでいけばOKです。 ただし、この作業でUnicode化させてしまうと、Unicode未対応のHTML作成ソフトでは2度と編集できなくなるので、注意が必要です。
――ん、"Unicode未対応のHTML作成ソフト"? それでは、対応しているソフトもあるのか?と思われた方に朗報。

あるんです!

Dream Weaver、FrontPage200x、Netscape(Mozilla) Compserなどがその代表格です。これらを使えば、タグを打ち慣れない方でも、簡単に日中混在のWEBを作ることができます。

1  2  3

Copyright(C) 1999- ad-hexing.com All Rights Reserved.