【发布时间】:2012-10-07 01:36:37
【问题描述】:
我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。
我注意到 HXT 对文本使用简单的 String 表示(Unicode 字符列表!!!)。
Constructors
XText String ordinary text (leaf)
XBlob Blob text represented more space efficient as bytestring (leaf)
解析时如何在两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别吸引人的功能,尤其是在 XML 文档包含大量文本内容的情况下。
另外,我在 Google 上找到了 http://hackage.haskell.org/package/hxt-unicode,但不确定它打算如何用于解析。过去对 Unicode 的支持也更加明确:http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但该模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。其背后的动机是什么?
有人可以提供一些示例代码,以及如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢。
【问题讨论】:
-
哪个办公室会宣布“在 Haskell 中处理 Unicode XML 的官方解决方案”?关于HXT,我不是要推荐的,整个源码都有示例文件:github.com/UweSchmidt/hxt。