【问题标题】:Conversion to data format for crfsharp ...转换为 crfsharp 的数据格式...
【发布时间】:2014-03-20 12:29:32
【问题描述】:

我有一个包含大约 250000 条酒店评论的评论数据集,我计划使用 crfsharp dll 从中提取方面,但是我拥有的数据是普通文本段落形式,我需要将其转换为格式的crfsharp,所以我可以训练和测试数据以提取方面。那么有人可以告诉我什么是最好的方法,我正在考虑编写一个用于数据格式转换的小程序。 另一件事我想知道 CRF sharp 是否可以使用它拥有的 crf 模型进行方面提取?我正在使用 c#。

【问题讨论】:

    标签: c# extraction aspect dataformat


    【解决方案1】:

    您将在任务中使用哪些功能和标签? 有一个最简单的例子。一句话“!东京和纽约是主要的金融中心”。如果您想从中提取位置名称并且您唯一的特征是令牌字符串,您可以生成训练语料库,如下所示:

    !也不 东京地点 和 NOR 新地点 约克位置 不是 主要NOR 金融NOR 中心 NOR .也不是

    第一列是句子的term,第二列是对应的标签。 NOR 表示普通术语,LOCATION 表示位置名称。您可以生成上述格式的训练语料库并使用 CRFSharp 训练模型。

    对于更复杂的例子,比如更多的特征,模板,在标签中添加单词位置,你可以参考CRFSharp主页中的另一个例子(http://crfsharp.codeplex.com)。

    【讨论】:

    • 是的,我很久以前就做过,必须创建一个小型 c# 应用程序来快速创建训练语料库。 :) 谢谢。
    猜你喜欢
    • 2018-10-19
    • 1970-01-01
    • 2016-08-05
    • 2023-02-14
    • 1970-01-01
    • 2017-10-10
    • 2014-02-27
    • 2015-05-02
    • 2014-11-22
    相关资源
    最近更新 更多