Windowsでファイルの文字コードを判別する方法

コンピュータ上では様々な文字コードが使われています。WindowsではShift-JISコードが標準的に使用されていますが、Unix/LinuxやMacではその他の文字コードも使用されています。そして、文字コードと使用環境が適合していない場合、テキストデータが文字化けを起こして正しく読み取れないなど様々な問題が発生します。このような状態を解消するためにも使用しているテキストデータの文字コードについて知ることは非常に大切です。

今回は、ファイルの文字コードを判別する具体的な方法について確認していきましょう。

Internet  Explorerで確認する方法

Internet  Explorerを開き、画面内にテキストファイルをドラッグ&ドロップで開いてみましょう。通常は適切な文字コードで表示されるので、そのまま画面を右クリックして「エンコード」をクリックすると文字コードの種類が確認できます。もし文字化けになってしまっていたら「エンコード」から文字コードを一つ一つ選択してみてください(日本語のShift-JISコードやEUC、Unicodeのいずれかである可能性が高いです)。そこで正常に表示されたものが適切な文字コードであると言えます。

001

テキストエディタで確認する方法

少しリッチな機能を搭載されたテキストエディタでは簡単に文字コードの種類を確認することができます。フリーソフトのサクラエディタであれば、カーソルを文字に合わせると画面下部のステータスバーに表示されます。

TeraPadも同様で、テキストファイルを開いた状態で文字コードの種類は画面下部に表示されています。

シェアウェアでメジャーな秀丸エディタの場合はカーソルを文字に合わせた状態で、上部メニューの「その他」→「コマンド一覧」→「その他」→「文字コードの表示」の順番でクリックすると確認できます。

通常はWindowsで作成されたテキストファイルであればShift-JISコード、unix系の場合はEUC等、テキストファイルを作成したパソコンのOSがデフォルトで使用している文字コードが表示されているはずです。

002

nkfコマンドで確認する方法

コマンドプロンプトを良く使用する環境であれば、nkf(Network Kanji Filter)というツールのの-gコマンドでファイルの文字コードを確認することができます。まずはツールを適当なフォルダへダウンロードし、「nkf32.exe」という実行ファイルを実行用フォルダへコピーしてください(よく分からない場合は後で使用するコマンドプロンプト起動時に表示されているパスでも大丈夫です)。

次にスタートメニュー→すべてのプログラム→アクセサリの順番でクリックし、コマンドプロンプトを立ち上げてください。それからnkf32.exeと同じフォルダに文字コードを調べたいテキストファイルを保存し、コマンドプロンプトの黒い画面に「nkf32 -g ファイル名」と打ち込みます。

そのままEnterキーを押すと文字コードの種類が表示されます。

Microsoft Wordで文字コードを確認

文字コードの種類だけではなく、文字に割り当てられている数値そのものを知りたいという場合はWordの機能が便利です。まず文字コードを調べたい文字をWordに貼り付け、ドラッグして選択した状態にして右クリック→「記号と特殊文字」で文字コードを調べることができます。文字セットが一覧表示されていて、クリックするだけで各々の文字コードを確認することができるので非常に使いやすい機能です。

003

まとめ

テキストファイルがShift-JISコードやUnicode等、どんな文字コードで作成されているのかはIEや各種テキストエディタ、コマンドプロンプトなどを使用すると簡単に知ることができます。さらにWordを使用すると文字の一つ一つにどんな数値が割り振られているのかまで細かく確認することができるのです。

普段あまり意識することのない文字コードですが、意外に身近なアプリケーションでチェックすることができるのでこれらの機能を活用して適切な形式でテキストファイルを作成・加工するようにしてください。


イベント

2017/12/05(火)
Design Thinking Square