日本語・アイヌ語・エスペラント混在テキストをw3mで表示

| コメント(0) | トラックバック(0)

JIS2004の符号化方式の一つShift_JIS-2004で符号化された「アイヌタイムズ」の記事を文字型ウェブブラウザのw3mで表示してみました。このテキストには日本語・アイヌ語(ラテン文字・片仮名)・エスペラントが混在しています。下の画像が表示画面です。

アイヌタイムズのw3mでの表示画面

「ㇰ」や「ㇻ」といったアイヌ語特有の片仮名や、エスペラント文に使われている「ŝ」や「ĝ」のようなダイアクリティカルマーク付きのラテン文字が表示されているのが見て取れます。Shift_JIS-2004ではこうした文字を自由に使うことが出きるのです。

ただし、この画面ではダイアクリティカルマーク付きのラテン文字は全角幅で表示されてしまっています。これは表示系の問題であって、JIS X 0213が文字幅を定めているわけではありません。また、アイヌ語の分かち書きのためにあけているスペースが詰められてしまっています。これはw3mのレンダリングの問題でしょうか。

同じくw3mでHTMLソースを表示すると下の画面のようになります。ソースでは分かち書きされていることが分かります。

アイヌタイムズのw3mでのソース表示画面

w3mでJIS X 0213を使うには、oキーを押して出る設定画面で、JIS X 0213の使用を指定してやる必要があります。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/100

コメントする

最近のブログ記事

ゲッティと英語と日本語
私は1年ちょっと前くらいから、自分で撮っ…
ウソに戸惑う
JIS X 0213の追補1:2004で…
第3第4水準辞書を使おう!
いまだに、広く使われている日本語入力環境…
文字コードを知るための本棚
当サイトのメモのセクションに「文字コード…
今年もやります
震災被災地支援プログラム2012を実施し…