【发布时间】:2016-03-18 02:24:37
【问题描述】:
我正在使用 camel 2.14.1 并在 tokenize 标记中使用 group=10000 拆分带有中文/日文字符的巨大 xml 文件。 基于分组成功创建文件,但中日文本代码被转换为垃圾字符。
我尝试在使用“ConvertBodyTo”创建新的 XML 之前强制执行 UTF-8,但问题仍然存在。
谁能帮帮我!!
【问题讨论】:
-
我观察到的一件事是新生成的文件中缺少 XML Prologue,并且怀疑这是导致问题的原因。 :S
-
请显示您目前的代码,并与help center 联系以获取更一般的发布指南。
-
我已经使用处理器类在我的拆分 xml(s) 中手动添加了 XML Prologue/DTD,即在我的处理器中创建一个文件,附加 XML DTD 标记并将正文发送回
-
您收到反对票和接近票的原因是您的问题不包含我们需要的信息,以便我们花费有用的时间帮助您,更不用说解决您的问题了。请查看help center 中的发布指南,然后查看edit 您的问题以提供缺失的详细信息。通常,您的问题应该是独立的,包括您遇到问题的代码,以及输入样本、实际输出和预期输出。希望这会有所帮助。
标签: encoding utf-8 apache-camel tokenize