好的,这将是一个很大的答案。
我认为您需要的是解析器生成器。一种根据给定语法生成代码以解析文本的软件。这些解析器通常有两个主要组件:词法分析器和解析器。词法分析器识别 TOKENS(单词),解析器根据您的语法检查标记顺序是否正确。
在词法分析器中,您应该声明以下标记
TOKENS ::= (AND, OR, NOT, WORD, WORDSTAR, LPAREN, RPAREN, QUOTE)
WORD ::= '/w+/'
WORDSTAR ::= '/w+\*/'
语法应该这样定义:
QUERY ::= word
QUERY ::= wordstar
QUERY ::= lparen QUERY rparen
QUERY ::= QUERY and QUERY
QUERY ::= QUERY or QUERY
QUERY ::= QUERY and not QUERY
QUERY ::= quote MQUERY quote
MQUERY ::= word MQUERY
MQUERY ::= word
此语法定义了一种具有您需要的所有功能的语言。根据您使用的软件,您可以定义处理每个规则的函数。这样,您可以将文本查询转换为 sql where 子句。
我不是很喜欢 php,但我在网上搜索了一个解析器生成器,然后出现了 PHP_ParserGenerator。
请记住,只要您的数据库不断增长,这些查询就可能成为结构化存储系统的问题。
您可能想尝试一个全文搜索引擎,它允许您执行此功能以及与文本搜索相关的许多其他功能。这就是IndexTank 的工作原理
首先,您将所有数据库记录(或文档)添加(或搜索方言中的“索引”)到 IndexTank。
$api = new ApiClient(...);
$index = $api->get_index('my_index');
foreach ($dbRows as $row) {
$index->add_document($row->id, array('text' => $row->text));
}
之后,你可以在索引中搜索所有你想要的操作符
$index = $api->get_index('my_index');
$search_result = $index->search('Apples AND Oranges');
$search_result = $index->search('Apples OR Oranges');
$search_result = $index->search('Apples AND NOT Oranges');
$search_result = $index->search('"apples oranges"');
$search_result = $index->search('Apples AND ( Oranges OR Pears )');
$search_result = $index->search('Appl*');
希望我回答了你的问题。