我需要用通用语言来表示内容,也就是现在的 HTML5标准 – 我的目标不是在网络浏览器中显示页面.我只需要代表内容,没有界面,没有布局,没有逻辑(没有 Javascript). 正如在other questions(或p
正如在other questions(或programmers questions)和the W3C HTML5’s Recommendation, “HTML vs XHTML” section所记得的,
the DOM, the HTML syntax, and the XHTML syntax cannot all represent the same content.
好的,但是~90%可以是相同的(!),并且,如果我不需要Javascript,样式等,我可以强制执行一些约束,它将是100%…所以,问题是关于什么约束我需要使用(?)来确保所有序列化为XHTML5的HTML5都代表相同的东西,反之亦然(XSLT将支持原始的HTML5文档).
有一个“HTML5元素的子集”或“具有一些附加约束的子集”,以确保reversibility的XHTML5 / HTML5转换?
Polyglot Markup: A robust profile of the HTML5 vocabulary,其当前是 W3C Candidate Recommendation,定义文档的规则[…] that is a stream of bytes that parses into identical document trees (with some exceptions, as noted in the 07002) when processed either as HTML or when processed as XML.
您可以在section 4: Writing HTML documents找到编写此类文档的规则.