【发布时间】:2013-04-09 18:48:03
【问题描述】:
我使用Mediawiki api 来从维基百科页面获取内容。
我编写了一个生成下一个查询的代码(例如):
仅检索关于夏威夷的维基百科页面的开头段落。
问题是您可能会注意到有很多不相关的子字符串,例如:
"[[Molokai|Moloka{{okina}}i]], [[Lanai|Lāna{{okina}}i]], [[Kahoolawe|Kaho{{okina}}olawe]], [[Maui]] and the [[Hawaii (island)|"。
所有这些括号 [[]] 都不相关,我想知道是否有一种优雅的方法可以只从这些页面中提取“干净”的内容?
提前致谢。
【问题讨论】:
-
你真的只想要第一部分,还是只是一个例子?
标签: php wikipedia wikipedia-api mediawiki-api