【问题标题】:Use GATE library in java (Netbeans) for POS tagging在 Java (Netbeans) 中使用 GATE 库进行 POS 标记
【发布时间】:2013-10-14 17:36:12
【问题描述】:

实际上,我正在尝试使用 java 编写自己的程序,以便对一组文本文件进行 POS 标记。我搜索了可用的 NLP 工具,发现 GATE 是用于文本处理的最佳 NLP 工具之一。我想先下载它然后我不想使用 GUI。我希望在我自己的 java 程序中使用它。

所以

  1. 如何在 GATE 和 Netbeans 之间建立连接?
  2. 如何在我的代码中使用词性识别?

我是 NLP 和 GATE 的新人。我只是在几个小时前开始。但我是文本挖掘领域的博士生,我想处理一些 NLP 工具,因为我在学习中需要它们。我希望你能帮助我找到任何关于如何在 GATE 和 java 之间集成以使用这些库以及我们如何使用它们的教程。

感谢您的时间和考虑

【问题讨论】:

    标签: java gate


    【解决方案1】:

    最好的教程材料是来自常规培训课程的讲义,可在http://gate.ac.uk/wiki 获得(查找最新的“培训课程参与者的维基”)。特别是模块 5 讨论了从 Java 代码调用 GATE API。

    我不想使用 GUI。我希望在我自己的 java 程序中使用它。

    即使您不想在生产系统中使用 GUI,我们也始终建议您首先在 GUI 中设置和测试管道。当您满意时,您可以使用“保存应用程序状态”或“为 GATECloud.net 导出”来保存应用程序,然后您的代码可以使用 PersistenceManager.loadObjectFromFile 加载完全配置的管道,而无需首先加载正确的插件,然后手工组装管道组件。

    【讨论】:

    • 感谢您的 cmets 和回答....对不起,我有一个关于“管道”的一般性问题,它的真正含义是什么???对不起,因为我是这个领域的新手,所以我不太了解.. 谢谢,我希望我能从你那里得到更多有用的信息......
    • @QusaiRamadan “管道”是我们用于一系列组件的名称,这些组件一个接一个地运行以处理文档。例如,对于 POS 标记,您首先需要一个 Tokeniser 将文本拆分为单词,一个句子拆分器将标记分组为句子,然后实际的 POS 标记器将标记分配给标记。
    • 谢谢...我现在正在安装 GATE,我会仔细阅读您发送给我的内容。我希望我们可以保持联系,因为我看到你对这个话题有很好的背景。我希望你能和我保持联系。感谢您的时间和考虑
    • @QusaiRamadan 如果您有任何问题,最好的办法是订阅邮件列表 (gate.ac.uk/mail) 并将它们发布到那里,它在 GATE 社区中的受众比您所能接触到的要广泛得多在堆栈溢出上。
    • 好的,我现在就做......谢谢你的建议,正如我所说,如果我们能保持联系,我会很高兴......
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-12-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-08
    • 1970-01-01
    相关资源
    最近更新 更多