当前位置 : 主页 > 编程语言 > c语言 >

c# – 寻找样本以验证UTF-8

来源:互联网 收集:自由互联 发布时间:2021-06-25
假设我有一个字节流(数组),我想编写代码(使用.Net C#)来验证它是否是有效的UTF-8字节序列.我想从头开始编写代码,因为我需要报告存在无效字节序列的确切位置,甚至可能删除无效字节 –
假设我有一个字节流(数组),我想编写代码(使用.Net C#)来验证它是否是有效的UTF-8字节序列.我想从头开始编写代码,因为我需要报告存在无效字节序列的确切位置,甚至可能删除无效字节 – 不仅仅是想要判断字节流/数组是否有效.

是否有任何示例代码可供参考?如果没有C#代码,那么C / Java中的简单样本也会受到赞赏.谢谢!

对于UTF-8的无效字节序列,我的意思是

http://en.wikipedia.org/wiki/UTF-8#Invalid_byte_sequences

提前致谢,
乔治

你需要的是 DecoderFallback.当Encoding类试图将字节序列转换为目标编码时,你可以指定回退行为:

> report error and stop processing.
>或find the error and replace it.

使用UTF8Encoding和DecoderReplacementFallback,您可以实现您正在寻找的东西.

网友评论