【发布时间】:2013-11-02 22:17:52
【问题描述】:
我有 xml 格式的维基百科文章,我只需要提取项目文章中的单词。我在 XML 解析方面没有经验。有没有提取所有单词的工具或库?
【问题讨论】:
-
最好的开始方式是谷歌搜索
extracting and parsing wikipedia article并添加您选择的编程语言的名称。 -
@Pekka웃 这里又快又脏:bit.ly/16WJEPo
标签: html xml-parsing