获取角色的unicode值

时间:2010-02-08 08:42:00

标签: java unicode

Java中是否有任何方法可以使Unicode与任何字符相当? e.g。

假设方法getUnicode(char c)。致电getUnicode('÷')应该返回\u00f7

7 个答案:

答案 0 :(得分:58)

您可以在此处使用单行代码对任何Java字符执行此操作:

System.out.println( "\\u" + Integer.toHexString('÷' | 0x10000).substring(1) );

但它只适用于Unicode字符,直到Unicode 3.0,这就是为什么我为你准备任何Java char的原因。

因为Java是在Unicode 3.1出现之前设计的,因此Java的char原语不足以表示Unicode 3.1及以上:不再有“一个Java字符到一个Java char”映射(而是使用了一个怪异的hack)。 / p>

因此,您必须在此处检查您的要求:您是否需要支持Java char或任何可能的Unicode字符?

答案 1 :(得分:33)

如果您使用的是Java 5,请使用char c = ...; String s = String.format ("\\u%04x", (int)c);

如果您的源不是Unicode字符(char)而是字符串,则必须使用charAt(index)来获取位置index处的Unicode字符。

不要使用codePointAt(index),因为它将返回24位值(完整的Unicode),不能用4个十六进制数字表示(它需要6个)。请参阅the docs for an explanation

[编辑]为了说清楚:这个答案不使用Unicode,而是Java用来表示Unicode字符(即代理对)的方法,因为char是16位,Unicode是24位。问题应该是:“如何将char转换为4位十六进制数”,因为它不是(真的)关于Unicode。

答案 2 :(得分:12)

private static String toUnicode(char ch) {
    return String.format("\\u%04x", (int) ch);
}

答案 3 :(得分:6)

char c = 'a';
String a = Integer.toHexString(c); // gives you---> a = "61"

答案 4 :(得分:0)

我在网上发现了这个很好的代码。

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;

public class Unicode {

public static void main(String[] args) {
System.out.println("Use CTRL+C to quite to program.");

// Create the reader for reading in the text typed in the console. 
InputStreamReader inputStreamReader = new InputStreamReader(System.in);
BufferedReader bufferedReader = new BufferedReader(inputStreamReader);

try {
  String line = null;
  while ((line = bufferedReader.readLine()).length() > 0) {
    for (int index = 0; index < line.length(); index++) {

      // Convert the integer to a hexadecimal code.
      String hexCode = Integer.toHexString(line.codePointAt(index)).toUpperCase();


      // but the it must be a four number value.
      String hexCodeWithAllLeadingZeros = "0000" + hexCode;
      String hexCodeWithLeadingZeros = hexCodeWithAllLeadingZeros.substring(hexCodeWithAllLeadingZeros.length()-4);

      System.out.println("\\u" + hexCodeWithLeadingZeros);
    }

  }
} catch (IOException ioException) {
       ioException.printStackTrace();
  }
 }
}

Original Article

答案 5 :(得分:0)

你是否对使用Unicode很挑剔,因为如果你编写你的程序使用java它会更简单&#34; dec&#34; value或(HTML-Code)然后你可以简单地在char和int之间转换数据类型

char a = 98;
char b = 'b';
char c = (char) (b+0002);

System.out.println(a);
System.out.println((int)b);
System.out.println((int)c);
System.out.println(c);

提供此输出

b
98
100
d

答案 6 :(得分:0)

首先,我得到了char的偏高。之后,获得低端。转换HexString中的所有内容并添加前缀。

int hs = (int) c  >> 8;
int ls = hs & 0x000F;

String highSide = Integer.toHexString(hs);
String lowSide = Integer.toHexString(ls);
lowSide = Integer.toHexString(hs & 0x00F0);
String hexa = Integer.toHexString( (int) c );

System.out.println(c+" = "+"\\u"+highSide+lowSide+hexa);