【发布时间】:2019-07-04 09:35:53
【问题描述】:
我的问题是我想从原始 xmls 创建 xmls 文件的子集,同时保持相同的结构。你可以说我想过滤得到一个子集。
在我处理 Medline 数据库时,处理此类任务的最佳方法和最有效的方法是什么!
【问题讨论】:
我的问题是我想从原始 xmls 创建 xmls 文件的子集,同时保持相同的结构。你可以说我想过滤得到一个子集。
在我处理 Medline 数据库时,处理此类任务的最佳方法和最有效的方法是什么!
【问题讨论】:
这里是一个广泛的概述。
完整读取输入的xml文件。
决定要在哪个级别拆分 xml 文件。 (例如 3 级)
确定感兴趣的标签。您可以提前决定标签或向用户提供一些 gui 以选择需要哪些标签。您还可以将输入文件拆分为多个文件,其中包含输入文件的所有标签。
创建输出文件。例如到第 3 级,文件是相同的。从第 4 级开始,您将拥有许多不同的文件。
例如如果你有像
这样的 xml 文件<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
<L4b> .... </L4b>
<L4c> .... </L4c>
</L3>
</L2>
</L1>
你可以制作3个输出文件
<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
</L3>
</L2>
</L1>
<L1> ....
<L2> ...
<L3> ....
<L4b> .... </L4b>
</L3>
</L2>
</L1>
等
【讨论】: