2013/09/21

コマンドプロンプトの文字コードを変更する(SJIJ→UTF-8など


コマンドプロンプトのデフォルトの文字コードは、Shift-JISとなっている。

確認方法は、
コマンドプロンプトのウィンドウで右クリック → プロパティ → [オブション]タブの「現在のコード ページ」に表示されている。


文字コードがShift-JISになっているため、文字コードがUTF-8などの ファイルなどを読み込むと文字化けしてしまう。
適切な文字コードで読み込む必要がある。



文字コードを変える



「CHCP」コマンドを使用する。
ちなみに「CHCP」とは「CHange Code Page」の略
「CHCP」コマンドを実行すると、現在のコードが表示される。
> CHCP
現在のコード ページ: 932
「CHCP」コマンドにコード ページ番号を指定すると、文字コードが変更される
> CHCP 65001
Active code page: 65001



実際に使ってみる



 UTF-8で保存した「document.txt」を読み込んでみる。

Shift-Jisの場合


ひらがな、カタカナで書いた部分が文字化けしている。


UTF-8の場合


実際のテキストの内容は以下の通り。
文字コードをUFT-8にして読み込むと、正常に表示された。




文字コード一覧


 一般的によく使う文字コードは下記のコード
  • 932  :shift_jis :ANSI 日本語SJIS
  • 20932 :EUC-JP :日本語EUC
  • 65001 :utf-8 :Unicode

コード ページ番号の一覧は、Code Page Identifiers.aspxを参照



以上

0 件のコメント :

コメントを投稿