next up previous contents
Next: Abstract Up: WWW文書のための多言語ブラウザとそのサーバシステム Previous: WWW文書のための多言語ブラウザとそのサーバシステム

内容梗概

本論文では,ユーザの端末側にフォントを必要としないWWW文書のための多言語ブラウザの方式を提案し,そのサーバシステムの構築,ブラウザの利用方法,サーバシステムの管理方法,およびインターネット上でのサービスの提供実験の概要とその評価について述べる.

図書館は従来から多言語の資料を蓄積し,提供してきている. したがってディジタル図書館の実現に際しても多言語の文書を扱える環境は必須である. しかしながら現在のコンピュータ上で多言語の文書を扱う環境は貧弱であると言わざるを得ない. この理由として,第一に多言語を扱える文字コード系が一般に普及していない,第二に通常コンピュータ上にその国で使われる文字フォントしか用意されていないという二つの問題点を指摘することができる. 前者の問題については,多言語を扱える文字コード系としてUnicode(ISO-10646-1)が普及してきており,将来的にはある程度改善されることが期待される. しかし,後者の問題については,将来的にも簡単に解決できるものではないと思われる. 現状では,例えば日本で使われるコンピュータ上には日本語と英語のフォントしか用意されておらず,他の言語を扱うにはその都度フォントや対応するソフトウェアを用意しなければならない. 将来的にUnicodeなどの多言語を扱える文字コード系が普及したとしても,すべてのユーザの端末にマイナーな言語を含む全世界の言語の文字フォントを用意することは将来的にみても現実的ではないと思われる. また,図書館の観点からすると,OPACなどの図書館情報システムでは従来から書名や著者名などに外字が使われているが,外字に限らず古典文字などの既存の文字セットに含まれない文字も例外なく扱えるべきである. これはディジタル図書館の実現には欠かすことのできない基本的機能であると言えるが,現在のWWWの枠組では考慮されていない.

これらの問題に対処するための一つの方法として,本研究ではユーザの端末側にフォントのインストールの必要がないWWW文書のための多言語ブラウザとそのサーバシステムを開発した. フォントをインストールせずに文書を表示する方法としては,各文字をインラインイメージとする方法,文書全体を一枚のインラインイメージとする方法などが考えられるが,ネットワーク的な処理コストやイメージファイルの大きさなどの点から実用的ではない. そこで,HTMLテキストに必要最小限のフォントのビットマップ情報を付加する新たな文書フォーマット(Multilingual-HTML: MHTML)を定義し,これを基に多言語ブラウザとそのサーバシステムを開発した. この文書フォーマットを用いることにより,ネットワーク的な処理コストと転送バイト数の大幅な低減が図れ,実用的な処理時間での文書のブラウジングが可能となった.

サーバシステムは,ユーザの端末上で動作するビューアと,WWWサーバとビューアの中間に位置するMHTMLサーバの二つの部分から構成される. ビューアはWWWブラウザ上のJavaアプレットとして実現しており,ユーザからの要求によってMHTMLサーバから自動的にダウンロードされ,ユーザの端末上で動作する. ビューアは,ユーザからの要求の受け付けやMHTMLサーバから受け取った文書の表示,ナビゲーションなど,WWWのブラウザとして必要な機能を持つ. MHTMLサーバは目的の文書があるWWWサーバと,ユーザの端末上で動作するビューアの中間に位置している. MHTMLサーバはネットワーク上の複数のビューアからの要求を受け付け,ユーザが指定した文書をWWWサーバから代理取得し,それを必要最小限のフォントを付加したMHTMLフォーマットに変換し,ビューアに返す. この方法により,ビューアが動作する端末上にはフォントを全く必要とせずに,MHTML文書中に含まれるフォントだけで文書の表示を行うことができる. また,ISO-2022-JP-2で規定される多言語に対応する符号化方法を用いてHTML文書を記述することで,一文書中に複数の言語が混在する文書の表示が容易に可能となる. またサービス提供者がMHTMLサーバに新たに文字集合を追加したり外字を独自に定義することも,設定ファイルの変更により可能である.

また,1996年8月より本サーバシステムをインターネット上で国際的に公開する提供実験を行っている. この提供実験では日本語,中国語(簡体字および繁体字),韓国語,タイ語の4ヶ国語についてサービスを提供しており,約5ヵ月間で学外から約1,500ページのアクセスがあった. このアクセス記録の分析と利用者による評価から,本システムの実用性の検証を行った.

Multilingual Browser for WWW Documents
and its Server System


Akira Maeda


Akira Maeda
1997年11月12日 (水) 19時53分15秒 JST