【问题标题】:Add column with number of occurrencies, reset for each record添加出现次数的列,为每条记录重置
【发布时间】:2021-05-29 11:02:00
【问题描述】:

我有行数可变的记录,A 列有 7 个可能的值,它们都是可重复的。

我需要一个基于 A 的新列 B,显示每条记录中每个值的出现次数。计数应在每条记录中重置。

我设法对 A 列中的行进行了排序,在每条记录中按字母顺序对它们进行排序,但我找不到正确的表达式来进行计数。我只能设法通过所有数据集(使用 text facet 或 facetCount)获取 A 中值的出现总数。

有什么线索吗?

【问题讨论】:

    标签: openrefine


    【解决方案1】:

    如果你有这个...

    ...想要这个...

    ...最简单的方法是打开 Jython/Python(而不是 GREL)并在“基于此列添加列”窗口中使用此公式:

    return row.record.cells['col2'].value.count(value)
    

    只需将 col2 替换为您的实际列名即可

    【讨论】:

      【解决方案2】:

      我在the mailing listrow.record.toRowIndex-row.record.fromRowIndex 找到了以下GREL表达式

      它在大型项目上执行得更快。

      【讨论】:

        猜你喜欢
        • 2014-12-06
        • 2012-08-23
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-12-22
        • 1970-01-01
        相关资源
        最近更新 更多