我正在设计一个API,它将URL作为输入,并读取该URL的内容.当URL是“file:”协议时,什么会为字符编码提供更好的默认值? 系统的本机编码 UTF-8 API允许显式设置.此外,我们可以使用一些启发
>系统的本机编码
> UTF-8
API允许显式设置.此外,我们可以使用一些启发式方法来确定字符编码,如BOM(如果可用),但是当所有这些都失败时,默认值应该是什么?
据我所知,标准在这个问题上没有提及.在其他条件相同的情况下,我希望对于那些甚至不知道存在字符编码等问题的人来说,最正常的事情就是发生.
如果可能,请始终使用UTF-8,并在API文档中记录. UTF-8是一个坚如磐石的标准编码和未来的证明 – 我会通过支持其他编码来避免为自己创造潜在的工作 – 如果你迁移API以便以这样的方式使用UTF-8将很容易使用它可以通过Web服务访问.