【发布时间】:2013-06-20 04:31:03
【问题描述】:
我正在使用 XercesC Lib 来创建我的数据的序列化。如何将其设置为 UTF-8?它总是使用 UTF-16 生成的,我找不到改变它的方法。
xercesc::DOMImplementation *gRegistry = xercesc::DOMImplementationRegistry::getDOMImplementation(X("Core"));
xercesc::DOMDocument *doc = gRegistry->createDocument(
0, // root element namespace URI.
X(oDocumentName.c_str()), // root element name
0); // document type object (DTD).
doc->setXmlStandalone(true);
... prepare the document ...
serializer = ((xercesc::DOMImplementationLS *)gRegistry)->createLSSerializer();
serializer->setNewLine(xercesc::XMLString::transcode("\n"));
XMLCh *xmlresult = serializer->writeToString(doc);
char *temp = xercesc::XMLString::transcode(xmlresult);
std::string result(temp);
xercesc::XMLString::release(&temp);
xercesc::XMLString::release(&xmlresult);
doc->release();
serializer->release();
getStream() << result.c_str();
当我在 Java 端使用 JAXB 反序列化时,我总是得到一个 content is not allowed in prolog,到目前为止,这是我在 XML 中看到的唯一区别。当我尝试在 JAXB 中进行本地反序列化时,它可以工作。当我使用我的 XercesC XML 时,我得到了这个错误。当我尝试使用 XML 插件在 Notepad++ 中对其进行格式化时,它还说有错误,但没有告诉我任何细节。
【问题讨论】:
-
我不确定,但也许您应该使用 ICU lib 构建 XercesC。请参阅此处的转码器选项说明xerces.apache.org/xerces-c/build-3.html