特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

不同编码格式下字符的输出效果

来源：互联网收集：自由互联发布时间：2021-06-28

EncodeDemo.java package cn.xuzihui;public class EncodeDemo {public static void main(String[] args) throws Exception {// TODO Auto-generated method stubString s = "中国ABC";//转换成字符序列用的是项目默认的编码GBKbyte[] byt

EncodeDemo.java

package cn.xuzihui;

public class EncodeDemo {

	public static void main(String[] args) throws Exception {
		// TODO Auto-generated method stub
		String s = "中国ABC";
		//转换成字符序列用的是项目默认的编码GBK
		byte[] byte1 = s.getBytes();
		for(byte b:byte1) {
			//把字节(转换成了int)以16进制的方式显示
			System.out.print(Integer.toHexString(b & 0xff)+" ");
			//输出结果: d6 d0 b9 fa 41 42 43 
		}
		
		System.out.println();
		byte[] byte2 = s.getBytes("gbk");
		//gbk 编码中文占用2个字节，英文占用一个字节
		for (byte b : byte2) {
			System.out.print(Integer.toHexString(b & 0xff)+" ");
			//输出结果: d6 d0 b9 fa 41 42 43 
		}
		
		System.out.println();
		byte[] byte3 = s.getBytes("utf-8");
		//utf-8 编码中文占用3个字节，英文占用一个字节
		for (byte b : byte3) {
			System.out.print(Integer.toHexString(b & 0xff)+" ");
			//输出结果: e4 b8 ad e5 9b bd 41 42 43 
		}
		
		System.out.println();
		//java是双字节编码 utf-16be
		byte[] byte4 = s.getBytes("utf-16be");
		//utf-16be 编码中文占用2个字节，英文也占用2个字节
		for (byte b : byte4) {
			System.out.print(Integer.toHexString(b & 0xff)+" ");
			//输出结果: 4e 2d 56 fd 0 41 0 42 0 43 
		}
		
		System.out.println();
		/*
		 * 当你的字节序列是某种编码时，这个时候想把字节序列变成字符串，
		 * 也需要用这种编码方式，否则会出现乱码
		 */
		String str1 = new String(byte4);//用项目默认编码
		System.out.println(str1); //输出为乱码
		
		String str2 = new String(byte4, "utf-16be");
		System.out.println(str2); 
		//输出结果: 中国ABC
		
		/*
		 * 文本文件就是字节序列，可以是任意编码的字节序列
		 * 如果我们在中文机器上直接创建文本文件，那么该文本文件只认识ansi编码
		 */
	}

}

上一篇：登陆功能
下一篇：Lucene_WriteDoucment

不同编码格式下字符的输出效果

相关文章