コマンドプロンプトのデフォルトの文字コードは、Shift-JISとなっている。
確認方法は、
コマンドプロンプトのウィンドウで右クリック → プロパティ → [オブション]タブの「現在のコード ページ」に表示されている。
文字コードがShift-JISになっているため、文字コードがUTF-8などの ファイルなどを読み込むと文字化けしてしまう。
適切な文字コードで読み込む必要がある。
文字コードを変える
「CHCP」コマンドを使用する。
ちなみに「CHCP」とは「CHange Code Page」の略
「CHCP」コマンドを実行すると、現在のコードが表示される。
> CHCP
現在のコード ページ: 932
「CHCP」コマンドにコード ページ番号を指定すると、文字コードが変更される> CHCP 65001
Active code page: 65001
実際に使ってみる
UTF-8で保存した「document.txt」を読み込んでみる。
Shift-Jisの場合
ひらがな、カタカナで書いた部分が文字化けしている。
UTF-8の場合
実際のテキストの内容は以下の通り。
文字コードをUFT-8にして読み込むと、正常に表示された。
文字コード一覧
一般的によく使う文字コードは下記のコード
- 932 :shift_jis :ANSI 日本語SJIS
- 20932 :EUC-JP :日本語EUC
- 65001 :utf-8 :Unicode
コード ページ番号の一覧は、Code Page Identifiers.aspxを参照
以上
0 件のコメント :
コメントを投稿