特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

Java避免UTF-8的csv文件打开中文出现乱码的方法

来源：互联网收集：自由互联发布时间：2021-05-13

本文实例讲述了Java避免UTF-8的csv文件打开中文出现乱码的方法。分享给大家供大家参考，具体如下：最近又遇到了需要提供csv下载功能的需求，不同的时需要用java来实现，心想简单，

本文实例讲述了Java避免UTF-8的csv文件打开中文出现乱码的方法。分享给大家供大家参考，具体如下：

最近又遇到了需要提供csv下载功能的需求，不同的时需要用java来实现，心想简单，就把以前php的版本重写了一遍，然后生成一份csv，用excel2007打开一看，里面的中文都是乱码，一下就懵了，以前好好的功能怎么突然不行了？？以前也一直用2007的啊！于是开始了漫长的google之旅。

看来看去，说的都是输出utf-8格式的csv需要在文件头先输出BOM（BOM不懂的可以google了），即0xEF 0xBB 0xBF三个字节，这样更摸不着头脑了，明明是对的，偏偏不成功，直到发现一个帖子：http://stackoverflow.com/a/9337150/1794493 ，里面提到2007需要装sp3才能识别BOM，shit！原来是这回事！里面同时又提到，用utf-16le编码输出貌似更通用，经测试确实如此，但是utf-16le的BOM是0xFF 0xFE，帖子里面说错了！下面是一个简单的测试结果：

excel版本附加包编码测试结果 2007 sp3 utf-8 yes 2007 无 utf-8 no 2007 sp3 utf-16le yes 2007 无 utf-16le yes 2011 无 utf-8 no 2011 无 utf-16le yes

因为条件有限，只测试了这几个版本，可见utf-16le是更通用的编码格式。下面附上java代码，main方法中采用utf-16le编码，最后调用了utf8编码的方法，最后会输出两种编码格式的csv文件：

import java.io.*;
/**
 * Created by zhaozhi on 15-5-29.
 */
public class TestCSV {
  public static String join(String[] strArr, String delim) {
    StringBuilder sb = new StringBuilder();
    for(String s : strArr) {
      sb.append(s);
      sb.append(delim);
    }
    String ret;
    if (strArr.length > 1) {
      ret = sb.substring(0, sb.length()-1);
    }
    else {
      ret = sb.toString();
    }
    return ret;
  }
  public static void main (String[] args) throws Exception {
    String[] heads = {"日期", "产品", "订单数"};
    String[][] rows = {
        {"20150228", "安卓", "23"},
        {"20150301", "web", "34"}
    };
    byte[] bom = {(byte)0xFF, (byte)0xFE};
    String fname = "d:\\utf-16le.csv";
    BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname));
    bo.write(bom);
    bo.write(join(heads, "\t").getBytes("utf-16le"));
    bo.write("\n".getBytes("utf-16le"));
    for (String[] row : rows) {
      bo.write(join(row, "\t").getBytes("utf-16le"));
      bo.write("\n".getBytes("utf-16le"));
    }
    bo.close();
    UTF8();
  }
  public static void UTF8() throws IOException {
    String line = "中文,标题,23";
    OutputStream os = new FileOutputStream("d:/utf-8.csv");
    os.write(239);  // 0xEF
    os.write(187);  // 0xBB
    os.write(191);  // 0xBF
    PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));
    w.print(line);
    w.flush();
    w.close();
  }
}

更多关于java相关内容感兴趣的读者可查看本站专题：《Java编码操作技巧总结》、《Java数学运算技巧总结》、《Java数据结构与算法教程》、《Java字符与字符串操作技巧总结》、《Java操作DOM节点技巧总结》和《Java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。

上一篇：微服务和分布式的区别详解
下一篇：SpringBoot设置首页(默认页)跳转功能的实现方案

Java避免UTF-8的csv文件打开中文出现乱码的方法

相关文章