文字コード別の文字化けの文章例と原因

コンピュータ上では全てのデータは0または1の2進数で表現されています。そして文字を表現するためのコード(0と1の組み合わせ)については文字コードと言うのですが、現在はパソコンの種類によりASCIIコードやJISコード、Unicode、EUCなど様々な文字コードが使われています。しかし同じ文字であっても文字コードの種類により異なるコードが割り当てられているため、パソコン側が正しく文字コードを指定しないと意味の通らない文字の羅列となってしまいます。このような現象のことを一般的には文字化けと呼んでいます。

今回は、文字化けの原因について詳しくご説明します。

Webページが表示されないパターン

インターネットでWebサイトを閲覧していると、正しく表示されず文字化けしてしまっているページが時々あります。Webページの本体はHTMLという言語で記述されているテキストファイルなのですが、JISコード・シフトJISコード・Unicode・EUCの4種類の文字コードのいずれかで作成されている可能性があります。そしてブラウザが文字コードの種類を間違えてテキストデータを表示しようとすると文字化けが発生します。

文字コード別の文字化けの文章例

UTF-8をシフトJISで表示した場合

01

普段あまり使用することのない漢字や半角カナの文字化けになります。糸偏や手偏の漢字が多く表示されることが特徴的です。

UTF-8をEUCで表示した場合

02

普段あまり目にすることが無い漢字や表示不可(?)の記号が表示されます。

シフトJISをUTF-8で表示した場合

03

大部分が表示不可の記号に文字化けします。また他の国の言語が表示されることもあります。

シフトJISをEUCで表示した場合

04

主に表示不可の記号や英数字などが表示されます。

EUCをUTF-8で表示した場合

05

大部分が表示不可の記号になります。英語は比較的正常に表示されますが、他の国の言語が表示されることもあります。

EUCをシフトJISで表示した場合

06

半角カナやあまりなじみのない漢字、記号等に文字化けします。

Webページの文字化けの対処法

Webページが文字化けしている場合は画面を右クリックして「エンコード」を選択し、先の4種類の文字コードを1つずつクリックして正常に表示されるか試してみましょう。

Webページのテキストは基本的に「自動選択」にしておけば適切な文字コードで表示されるはずですが、なぜ文字化けが起こってしまったのでしょうか。文字コードの種類はHTMLファイルの<META>タグというところに記述されています。しかし、ごく稀にこの<META>タグによる指定が間違っている場合があります。Webページが文字化けする原因は様々ですが、Webページを作成する際はきちんと内容を読んでもらうためにも、METAタグの指定にも気を配るようにしましょう。

CSVがExcelで開けない場合

Webページ以外のテキストファイルでも文字化けは発生します。例えばCSVファイルはExcelで開くことができるのですが、稀に文字化けしてしまい正常に表示することができないことがあります。こんなときはテキストファイルの読み込み時にウィザードから正しく表示される文字コードを指定するようにしましょう。文字コードを1つ1つ試していくとプレビューで表示確認をすることができるので、直感的にテキストファイルの設定を修正することができます。

メールで文字化けが起こった場合

受信したメールのテキストデータで文字化けが発生することもあります。この場合はメールのエンコードを変更して正常に表示されるか確認してみましょう。(Outlookであれば「メッセージ」タブ→「移動」→「アクション」→「その他のアクション」→「エンコード」と順にクリックして日本語(自動選択)を設定してください。)自動選択でも対応できない場合はさらに「その他」の一覧から該当しそうな文字コードを試してみてください。なお、受信側でどうしても文字化けを解消することができない場合はメールの送信側に連絡して表示可能な文字コードを設定してもらうようにしてください。

まとめ

文字化けはテキストファイルの文字コードの種類をコンピュータ側が間違えてしまう(または解釈できなかった)ことにより発生します。大抵は「エンコード」により手動で設定変更することにより解決できるのですが、どうしても不具合が発生する場合はテキストファイルの作成元に文字化けが発生していることを伝えて対応してもらうようにしましょう。


イベント

2017/12/05(火)
Design Thinking Square