Blog

Published on

RSS

copyrightマークの実体参照

©

©マークを実体参照で記述することの必要性の話。

思想があってCreative Commonsを使ってる場合なんかを除き、慣例として、サイトのフッターにはコピーライト表記を入れることがほとんどだろう。その際コピーライトマーク © は実体参照で入れることになっている。

例えばこんな風に。

<p>&copy;2013 1024jp</p>

もしくは、XMLで書いている場合、文字実体参照が使えないことに気付き、数値文字参照で©マークを呼び出しているかもしれない。となると、こう。

<p>&#169;2013 1024jp</p>

いずれにせよ、文字参照だ。

しかし、そもそもなぜ©は文字参照で書かれるのだろう。「それは、©が機種依存文字だから」である。まぁ、そう覚えたよね、最初にHTML勉強した頃。丸付き数字①を使って知らない人に怒られたり。あぁ、機種依存文字って、なんてマナー違反。けどさ、機種依存文字ってなんだっけ?

機種依存文字 ©

たとえば©という文字はShift_JISという文字コードに定義されていない。でも©使いたいよ!ってことで各OSが勝手にShift_JISに©を押し込めてマッピングしたわけなんだけど、それぞれ独自にやったもんだからその位置が異なる。だからMacで©で入力したつもりでもWindowsではそこに違う文字があるもんだから文字化けしたりする。これが機種依存文字と呼ばれるゆえんである。このような、コンピュータ上では普通に使えるけどweb上で他の人とやり取りするときには気をつけるべき記号というのが当時沢山あり、その一つが©であった。

つまりこれは、文字コードに依存した話なのである。それはShift_JISやLaten-1みたいな過去の標準化が進む前の領域の少ない文字コードでは問題であった。

UTF-8における ©

しかし、月日も世紀も変わり、なんらかのしがらみやこだわりを引きずってない場合、今日ほとんどのHTMLはUTF-8で書かれていると思う。UTF-8なら以前はわざわざ実体参照を使う必要があったウムラウト文字なんかも直接記述できる。便利な時代である。でも©マークは依然として参照文字。

で、そんなことがふと気になって調べたらこんなやり取りを見つけた。

要点としてはここ。

If you are using UTF-8 as the character encoding for your document, you can, within the raw HTML source, write a copyright symbol just as-is.

ですよねー。

つまり、きょうび UTF-8 でコンテンツを記述してるなら、わざわざ参照なんてしなくても直接 © を書けばいいじゃん、って話なのだ。これで十分なのだ。

<p>©2013 1024jp</p>

もちろん引き続き文字参照を使っても困ることはないのだが、特に数値文字参照はソースの可読性が下がるし、別に必要のない手続きだということになる。もう昔のように文中の café をわざわざ caf&eacute; と書くようなことはしないのと同様、©&copy; と書く必要もないのだ。

どうせUTF-8使ってんでしょ? もう、©マークは直接書こうぜ。

Comment

leave your comment