JMemo031

内部文字コード

そう、いつだって忘れがち。文字列はJava内部ではUTF-16で扱われていることを。

import java.io.UnsupportedEncodingException;

public class Test {

   public static void main(String[] args) throws UnsupportedEncodingException {
      // *** charの値をそのままintで表現 ***
      char a = 'あ';
      System.out.printf("%d : %X\n", (int)a, (int)a);
      // ↑12354 : 3042 と表示される(UTF-16の文字コード)
      
      // *** StringからcharAtで取得した値をintで表現 ***
      char b = "あ".charAt(0);
      System.out.printf("%d : %X\n", (int)a, (int)a);
      // ↑12354 : 3042 と表示される(UTF-16の文字コード)
      
      // *** UTF-16のバイト配列を使って文字列作成 ***
      byte[] bytes = "あ".getBytes();
      String s = new String(bytes, 0, bytes.length, "UTF-16"); 
      char c = s.charAt(0); // １文字目を取得
      System.out.printf("%d : %X\n", (int)c, (int)c);
      // ↑33440 : 82A0 と表示される(Shift-JISの文字コード)
   }
}

「JMemo031」をウィキ内検索

最終更新：2012年11月28日 18:01

やするん＠Wiki

メニュー

伝言板ログ

作品

言語

概念

開発環境

データベース・インフラ

テスト

サーバソフト

OS

ソフト

プロジェクト・バグ管理・バージョン管理

仮想マシン

リンク

自然言語

その他覚書

更新履歴

JMemo031

内部文字コード