假设我有一个字节流(数组),我想编写代码(使用.Net C#)来验证它是否是有效的UTF-8字节序列.我想从头开始编写代码,因为我需要报告存在无效字节序列的确切位置,甚至可能删除无效字节 –
是否有任何示例代码可供参考?如果没有C#代码,那么C / Java中的简单样本也会受到赞赏.谢谢!
对于UTF-8的无效字节序列,我的意思是
http://en.wikipedia.org/wiki/UTF-8#Invalid_byte_sequences
提前致谢,
乔治
> report error and stop processing.
>或find the error and replace it.
使用UTF8Encoding和DecoderReplacementFallback,您可以实现您正在寻找的东西.