UTF-8はUnicodeの符号化形式の一種で、ASCIIコードとの互換性も良くパソコンで扱いやすいことから、世界中の様々なソフトウェアで対応しています。テキストの文字形式がUTF-8でないとうまく処理されない場合は文字コード変換を行う必要があるのですが、具体的にはどのような方法があるのでしょうか。
メモ帳で文字コード変換
Windowsの標準アプリケーションであるメモ帳でもUTF-8への文字コード変換を行うことができます。
まずスタートメニュー→すべてのプログラム→アクセサリよりメモ帳を開きます。そしてメニューバーのファイル→名前を付けて保存をクリックして文字コードの項目をUTF-8に設定し、任意のファイル名で保存します(上書き保存でもOKです)。
他にもサクラエディタなどフリーのテキストエディタでも文字コード変換を行うことができます。やり方はほぼ同じで、テキストファイルをエディタで開き任意の文字コードでファイルを保存します。
ちなみにUTF-8で保存した場合は一部のテキスト用ソフトでは正しく表示されない場合もあるのでご注意ください。
Internet Explorerで文字コード変換
インターネットを閲覧するためのブラウザであるInternet Explorer(IE)でも文字コード変換を行うことができます。
まずは文字コード変換を行いたいファイルの末尾がtxtであることを確認してください。ファイル名が異なる場合は.(ドット)より後をtxtに変更して「○○○.txt」というようなファイル名に変更しましょう。
次にそのテキストファイルをIEの画面上にドラッグ&ドロップしてください。それから画面を右クリックして「エンコード」を選択しUnicode(UTF-8)がチェックされていることをご確認ください。もしUTF-8が選択されていない場合はエンコード→その他の順にクリックして表示された一覧よりUnicode(UTF-8)を選択してください。
テキストファイルに正しく文字コード変換が行われたらファイルを保存します。Altキーを押してメニューバーを表示させ、ファイル→名前を付けて保存よりダイアログを開きます。そして画面下の「エンコード」がUnicode(UTF-8)に設定されていることを確認して保存しましょう。
ちなみにファイルの種類よりWebページ形式とテキストファイル形式が選択できるので任意の保存形式を選択してください。
nkfコマンドにより文字コード変換
文字コード変換をしなくてはならないファイルが大量にあるという場合は、いちいちファイルを開いてコード変換してから保存するという作業だけでも大変です。そんなときはコマンドプロンプトからコマンドを打ち込むことにより文字コード変換を行うことができるツール「nkf」を使用してみてはいかがでしょうか。
nkfツールを保存
まずはnkfを使用する環境を設定します。ベクター等でファイルをダウンロードし、任意の場所に展開したフォルダ内の「nkf32.exe」というファイルをWindowsの環境変数「Path」に含まれるフォルダへとコピーします。
環境変数Pathの設定・確認方法
スタートメニュー→すべてのプログラムよりコマンドプロンプトを起動させてください。そして表示された黒い画面に「set」と打ち込むと様々な環境変数が表示されるので「Path」から始まる行に注目してください。セミコロンで区切られているPathの一覧が表示されています。
コマンドプロンプトでUTF-8に文字コード変換を行う
nkfを使用する環境が整ったら次のコマンドでテキストファイルをUTF-8に文字コード変換します。
nkf32 -w 変換元ファイルパス > 変換先ファイルパス
ちなみにコード変換してから元のファイルへ上書き保存する場合のコマンドは下記の通りです。
nkf32 -w --in-place(--overwriteでも可) 変換元ファイルパス
nkfで文字コード変換を行うとファイルを開く必要が無いので作業時間が短縮されます。またテキストエディタで開くことができないような大きいサイズのファイルでも処理することが可能です。大量の文字コード変換で悩んでいる場合はnkfをぜひ導入してみてはいかがでしょうか。
まとめ
UTF-8はLinuxなどで主流となっていますが、テキストファイルの操作においてはWindowsはShift-JISコードが標準的に使用されているのが現状です。このように異なる端末で作成されたファイルを変換しなくてはいけないパターンはまだまだ多いので、使用環境に応じた使い勝手の良い変換方法をぜひ試してみてください。