【问题标题】:how to integrate RAMDirectory into FSDirectory in lucene如何在lucene中将RAMDirectory集成到FSDirectory
【发布时间】:2010-10-12 09:25:49
【问题描述】:

我现在有一个问题,这个是关于 lucene 的。我试图制作一个可以进行索引并将它们首先存储在内存中的 lucene 源代码 使用 RAMDirectory,然后将内存中的该索引刷新到磁盘中 使用 FSDirectory。我对这段代码做了一些修改,但是 徒劳无功。也许你们中的一些人可以帮帮我。

那么对我来说,将 RAMDirectory 集成到此源中的最佳方式是什么? 将它们放入 FSDirectory 之前的代码。任何帮助,将不胜感激 尽管 这是源代码。

import org.apache.lucene.analysis.SimpleAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.FSDirectory;

import java.io.File;
import java.io.FileReader;
import java.io.IOException;

public class SimpleFileIndexer {
    public static void main(String[] args) throws Exception {
        File indexDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi");
        File dataDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi");
        String suffix = "txt";
        SimpleFileIndexer indexer = new SimpleFileIndexer();
        int numIndex = indexer.index(indexDir, dataDir, suffix);
        System.out.println("Total files indexed " + numIndex);
    }

    private int index(File indexDir, File dataDir, String suffix) throws Exception {
        IndexWriter indexWriter = new IndexWriter(
                FSDirectory.open(indexDir),
                new SimpleAnalyzer(),
                true,
                IndexWriter.MaxFieldLength.LIMITED);
        indexWriter.setUseCompoundFile(false);
        indexDirectory(indexWriter, dataDir, suffix);
        int numIndexed = indexWriter.maxDoc();
        indexWriter.optimize();
        indexWriter.close();
        return numIndexed;
    }

    private void indexDirectory(IndexWriter indexWriter, File dataDir, String suffix) throws IOException {
        File[] files = dataDir.listFiles();
        for (int i = 0; i < files.length; i++) {
            File f = files[i];
            if (f.isDirectory()) {
                indexDirectory(indexWriter, f, suffix);
            } else {
                indexFileWithIndexWriter(indexWriter, f, suffix);
            }
        }
    }

    private void indexFileWithIndexWriter(IndexWriter indexWriter, File f, String suffix) throws IOException {
        if (f.isHidden() || f.isDirectory() || !f.canRead() || !f.exists()) {
            return;
        }
        if (suffix != null && !f.getName().endsWith(suffix)) {
            return;
        }
        System.out.println("Indexing file " + f.getCanonicalPath());
        Document doc = new Document();
        doc.add(new Field("contents", new FileReader(f)));
        doc.add(new Field("filename", f.getCanonicalPath(), Field.Store.YES, Field.Index.ANALYZED));
        indexWriter.addDocument(doc);
    }
}

【问题讨论】:

  • 建议:将 lucene 标签添加到您的问题中。 StackOverflow 中有许多知识渊博的 Lucene 开发人员,如果您正确标记问题,他们会发现您的问题。
  • 好的,谢谢你的建议。 :-)

标签: java lucene


【解决方案1】:

我不确定这样做是否会获得任何性能提升,但您可以在 RAMDirectory 上执行所有索引,然后将目录复制到 FSDirectory。

像这样:

private int index(File indexDir, File dataDir, String suffix) throws Exception {
    RAMDirectory ramDir = new RAMDirectory();          // 1
    IndexWriter indexWriter = new IndexWriter(
            ramDir,                                    // 2
            new SimpleAnalyzer(),
            true,
            IndexWriter.MaxFieldLength.LIMITED);
    indexWriter.setUseCompoundFile(false);
    indexDirectory(indexWriter, dataDir, suffix);
    int numIndexed = indexWriter.maxDoc();
    indexWriter.optimize();
    indexWriter.close();

    Directory.copy(ramDir, FSDirectory.open(indexDir), false); // 3

    return numIndexed;
}

【讨论】:

  • 这一行在 Eclipse 中无法识别。 Directory.copy(ramDir, FSDirectory.open(indexDir));我们可以使用 Directory.copy 将索引复制到 FSDirectory 吗?
  • 我修好了线路,是的,就是这样。
猜你喜欢
  • 1970-01-01
  • 2014-12-22
  • 2016-06-25
  • 1970-01-01
  • 2013-07-31
  • 1970-01-01
  • 2014-10-07
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多