【发布时间】:2016-07-24 00:42:48
【问题描述】:
我想编写一个能够在源代码文件中搜索特定模式的程序......换句话说:输入是一段代码,例如:
int fib (int i) {
int pred, result, temp;
pred = 1;
result = 0;
while (i > 0) {
temp = pred + result;
result = pred;
pred = temp;
i = i-1;
}
return(result);
}
输出是包含这段代码或类似代码的文件。
在开源世界中,代码在其他项目中被重用。特别是库经常被复制到项目中。为了使错误修复更容易,我需要能够知道在哪些项目中使用了特定的库或代码。
因此我想尝试使用 apache solr。我不知道这是否是个好主意(我会很高兴一切可以帮助我)
我的计划是索引我的源代码文件……因此我需要一些工具吗?标记源代码文件。就像给我所有函数、变量等的名称一样。我可以用来提供 solr 索引的输出。但我不确定 apache solr 中是否已经有 tokenizer 或 dataimporthandler 可以解决问题?
【问题讨论】: