日本語の文字コードは3種類以上
なぜ、文字化けメールは起こるのでしょうか? 文字化けメールが起こる原因は様々ですが、まず第一に挙げられる原因は、日本語の文字コードには、主要なものだけでも3種類あることと関係しています。
もともとコンピュータはアメリカで発達したため、文字コードはASCII(American Standard Code for Information Interchange。直訳すると「情報交換のためのアメリカの標準コード」?)と呼ばれる、1バイト(7ビット/8ビット)ものの文字コードのみが前提として開発されてきました。俗に言う半角英数字のことです。
しかし、日本などアジア諸国がコンピュータを導入するとなると、この1バイト文字のASCIIでは表現しきれませんので、日本語を表示させるための文字コード(漢字コード)が各種団体で開発されることになりました。そして、この漢字コードが主なものだけでも3種類あるという訳です。
その3種類の漢字コードとは、
1.JISコード
ASCIIと同じく7ビットの文字コードでインターネットでメールを送る際には、このJISで送ることが暗黙の了解となっています。(実際には、半角カタカナが除外されたISO-2022-JPを利用してメール送信されます)。基本的には、このISO-2022-JPで送信されたメールは文字化けは起こりません。
試しに、皆さんのところに送られたメールのプロパティを見てみましょう。「Content-Type: text/plain; charset=iso-2022-JP」などというヘッダー情報が見えると思います。メールのプロパティーを見るには、Outlook Expressの場合なら、メールを選択し、右クリックで「プロパティ」を選び、次に「詳細」をクリッ
クすればOKです。メールのプロパティを見ると、「 Content-Transfer-Encoding: 7bit」というヘッダー情報が見えるかもしれません。「見えるかも」というのは、iso-2022-JPは7ビットと決まっているので、わざわざ書かなくても分るので、ヘッダー情報に含まれない場合もあるからです。
2.シフトJISコード
皆さんが使っているパソコンの各種アプリケーションで用いられている文字コードは、初期値では、この文字コードと考えて間違いないでしょう。ASCIIとは違って、8ビット文字です。Microsoft社によて提唱されましたので、MS漢字コードとも呼ぶようです。
メールを書く時はこのシフトJISで良いのですが、後述しますように送信時は前項のJISコード(ISO-2022-JP)で送信されるようにしておかないと文字化けが起こる可能性が高くなります(ほとんどのメールソフトでは、シフトJISで書かれたメールを送信時にJISに変換して送信するように自動的になっていますので、とくに意識する必要はありません。)。文字化けすると、「$」の多いメールとなります。
3.EUC
Extended Unix Codeの略。その名の通り、UNIX環境下で主に用いられます。ASCIIとは違って8ビット文字です。文字化けすると、半角カタカナが多いメールとなります。
のことです。その他、最近ではUTF-8が用いられるケースが増えてきています。UTF-8とは、多言語を表示するために開発された文字コードunicodeと呼ばれたものの一種です。UTF-8への各種メールソフトの対応状況は「ブラウザ・メールソフト別UTF-8対応状況」をご参照ください。
|