【发布时间】:2016-03-09 17:10:51
【问题描述】:
我为基于堆栈的语言编写了一个相当复杂的解析器,它将文件加载到内存中,然后通过比较标记来查看它是否被识别为操作数或指令。
每次我必须解析新的操作数/指令时,我都会将内存从文件缓冲区std::copy 转移到std::string,然后执行`
if(parsed_string.compare("add") == 0) { /* handle multiplication */}
else if(parsed_string.compare("sub") == 0) { /* handle subtraction */ }
else { /* This is an operand */ }
不幸的是,所有这些副本都使解析变慢。
我应该如何处理以避免所有这些副本?我一直认为我不需要分词器,因为语言本身和逻辑都很简单。
编辑:我正在添加获取各种操作数和指令副本的代码
// This function accounts for 70% of the total time of the program
std::string Parser::read_as_string(size_t start, size_t end) {
std::vector<char> file_memory(end - start);
read_range(start, end - start, file_memory);
std::string result(file_memory.data(), file_memory.size());
return std::move(result); // Intended to be consumed
}
void Parser::read_range(size_t start, size_t size, std::string& destination) {
if (destination.size() < size)
destination.resize(size); // Allocate necessary space
std::copy(file_in_memory.begin() + start,
file_in_memory.begin() + start + size,
destination.begin());
}
【问题讨论】:
-
你能说明你在哪里/如何创建副本吗?
-
@NathanOliver 当然,在这里。
-
您如何检查复制字符串是最慢的操作?
-
return std::move(anything)是错误的。哪个资源教你这样做? -
这就是人们构建 FSA 来匹配词位的原因;如果您不想使用真正的词法分析器生成器,您甚至可以手动编写代码。否则,您就是在抱怨已解决的问题。