【问题标题】:What's Haskell's attitude towards Unicode in XML?Haskell 对 XML 中的 Unicode 持什么态度?
【发布时间】:2012-10-07 01:36:37
【问题描述】:

我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。 我注意到 HXT 对文本使用简单的 String 表示(Unicode 字符列表!!!)。

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors
XText String    ordinary text (leaf)
XBlob Blob          text represented more space efficient as bytestring (leaf)

解析时如何在两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别吸引人的功能,尤其是在 XML 文档包含大量文本内容的情况下。

另外,我在 Google 上找到了 http://hackage.haskell.org/package/hxt-unicode,但不确定它打算如何用于解析。过去对 Unicode 的支持也更加明确:http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但该模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。其背后的动机是什么?

有人可以提供一些示例代码,以及如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢。

【问题讨论】:

  • 哪个办公室会宣布“在 Haskell 中处理 Unicode XML 的官方解决方案”?关于HXT,我不是要推荐的,整个源码都有示例文件:github.com/UweSchmidt/hxt

标签: xml haskell unicode hxt


【解决方案1】:

xml-conduit 包使用Text 数据类型来存储文本数据。在过去的几年里,它已成为标准的文本数据表示。 xml-conduit 是一个维护良好的包,我个人将它用于大量的开源和商业代码。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-06-10
    • 1970-01-01
    • 2012-10-17
    • 1970-01-01
    • 1970-01-01
    • 2011-07-15
    相关资源
    最近更新 更多