【发布时间】:2012-03-29 05:18:34
【问题描述】:
我想知道是否可以使用不同的配置文件集运行相同的 NUTCH 实例?我在参数列表中看不到任何允许此类事情的选项。
我只想在一台计算机上运行 NUTCH,我不想复制 nutch 实例。
有没有人知道这样做的简单方法,或者我需要自己修改 bin/nutch 脚本来完成它。
谢谢。
【问题讨论】:
我想知道是否可以使用不同的配置文件集运行相同的 NUTCH 实例?我在参数列表中看不到任何允许此类事情的选项。
我只想在一台计算机上运行 NUTCH,我不想复制 nutch 实例。
有没有人知道这样做的简单方法,或者我需要自己修改 bin/nutch 脚本来完成它。
谢谢。
【问题讨论】:
This nutch FAQ 应该很有用。答案描述了如何创建自定义 conf 目录并通过$NUTCH_CONF_DIR 环境变量让 nutch 指向它。
【讨论】:
您可以使用 Unix 符号链接并在脚本中更改此链接。比如,如果你有 regex-urlfilter-conf_A.txt 和 regex-urlfilter-conf_B.txt。在您的脚本中,在开始 nutch 之前:
对于会议 A:
ln -sf $NUTCH_FOLDER/conf/regex-urlfilter-conf_A.txt $NUTCH_FOLDER/conf/regex-urlfilter.txt
对于会议 B:
ln -sf $NUTCH_FOLDER/conf/regex-urlfilter-conf_B.txt $NUTCH_FOLDER/conf/regex-urlfilter.txt
【讨论】: