文字コード設定~MT編
January 23, 2005
全てはMovable Typeのブログを使用する事から始まった。MTのブログではデフォルトの文字コード としてUTF-8が使用されている。これは単一ドキュメント上で多言語表示するために、世界中の文字を 統合的に扱う為に作られた文字コード、UnicodeをUTF-8と言う形式で表すもの。ドキュメントの 文字コードをUTF-8形式で表示する事によって、Shift_JISやEUC-JP等では表示する事が出来ない文字、 例えばアクセント記号付き文字と日本語を混ぜて同一ドキュメント上で表記する事が出来たりする。
私個人レベルでは、特にアクセント記号付き文字を使用することもないし、Shift_JISやEUC-JPで カバーされていないような漢字などを表示する事もないので、MTブログの文字コードをShift_JISか EUC-JPにしても良かった。けれど、後々、色々と変更するのは面倒なので、多くの面で互換性が 高そうに見えたUTF-8のままで行くことにした。「互換性が高そうに見えた」と言うのは、私がblogを 始めようとしていた頃、weblogに特有だった技術RSSで、UTF-8出力が基本のようだったから。 当時は、RSSに付いては言葉すら読めど、どのように使用するものなのか、サッパリ分かっていなかった。 では、今は分かるのか?と言うとそうでも無く・・・。でも、興味があるのでRSSリーダをダウンロードして 試してみようかなとも思ったりしている。なので、その頃、RSSでUTF-8出力が基本のように思えたのは、 私が自分なりにGoogleで調べた上で分かったと言う制限の上に成り立っているので、本当はUTF-8 以外のエンコードでも出力出来、それを読む事が出来るリーダーがあったのかもしれない???。
今では、UTF-8以外の日本語の表示が可能な(文字化けしない)RSSリーダーがたくさん 出ているみたい。「 決定版 お勧め厳選ツール 2ちゃんねら~が選んだオススメFREE SOFT集」から、 「お勧めRSSリーダー」が出ている。 何だか、このサイト、色んなフリーソフトがあって便利そう。
各種文字コードについて参考になったサイト集:
atmarkIT:UTF-8とUTF16の違いは?
atmarkIT:文字コードを変換する
大阪外語大学 多言語同時処理室:文字コードのはなし
IT用語辞典 e-Words:文字コード
最新記事
- MTで検索タイムアウトが発生した場合
- MT7で新しいサイトを作るとき (自分用覚書)
- MT テーマのエクスポート時にファイルも選択する際、ファイル内に文字化けファイルがあるとエラー(自分用覚書)
- もしかして半身浴のお陰?花粉症の症状が出ません
- Hiromi: The Trio Project featuring Anthony Jackson
- Juneuary Weather 一気に寒く
- ローズガーデン at Burnaby Mountan
- やっとPRカード申請書を郵送
- きんぴらいなり寿司
- PRカードの更新・・!
- 今日の風景
- 5年前のちょうどこの時間帯に
- もうすぐ新年!
- ビクトリア北でM4.8の地震
- 中抜き化が進みつつある
Comments
yuralink
January 24, 2005 6:24 AM
Aぺ先生、いろいろ教えてください。
授業受けちゃってるみたい。楽しみだぁ~。
Aki
January 24, 2005 7:59 AM
Yucchi!どーもです。授業みたいら?文字コードって奥が深い。何かと私は文字コードについて調べる事が多いのだけど、ようやく最近になってその違いがすこーしづつ分かるようになりやした。でも、詳しいbites & bitsの表示の話になるとページをぶっ飛ばします。