我有一些使用SGML构建的文档,我有一个DTD文件来描述这个结构. 有人可以推荐一个兼容Python-3的库或模块来解析这些数据吗?对于Python 2.x,我的Google-fu似乎出现了SGMLParser,但这当然已被弃用
有人可以推荐一个兼容Python-3的库或模块来解析这些数据吗?对于Python 2.x,我的Google-fu似乎出现了SGMLParser,但这当然已被弃用(并且完全从Py3k中移除).
许多人似乎建议使用lxml,但由于依赖性问题,这对我来说不是一个选择.
我知道BeautifulSoup非常适合凌乱的标记,但A)最后我听说它不兼容py3k,而且B)这个内容结构合理.
BeautifulSoup已被弃用.使用替换,这是Py3k兼容:> BeautifulSoup4