【发布时间】:2013-04-22 21:01:56
【问题描述】:
我有一个 wiki 网站 (MediaWiki),我需要从每个 wiki 文章页面的第一行提取一些纯文本。每个 wiki 文章页面的第一行都有我想要的文本,但文本位于 wiki 标记标签内,例如:
$text = "Text that I DO NOT want '''Text that I do want, inside wiki tags''' text that I DO NOT want";
我已经找到了 PHP 正则表达式来获取第一行末尾的文本:
if(preg_match("/^.*/", $text, $match)){
echo "<br>This is the text in the first line of the wiki article page: ".$match[0];
}
我需要将上面的 /^.*/ 表达式与 PHP 正则表达式结合起来,以仅查找 ''' wiki 标记内的文本。我在这样做时遇到了麻烦。
有人可以帮我弄这个吗?另外,如何转义 ''' 单引号?
感谢您的所有帮助。
彼得
【问题讨论】:
-
你试过TextExtracts extension web API吗?
标签: php regex mediawiki-api