【问题标题】:OpenRefine split column with repetitive values具有重复值的 OpenRefine 拆分列
【发布时间】:2020-02-12 17:06:08
【问题描述】:

我在 OpenRefine 中有一个这样的列:

Title
A Star is born
Author
George Cukor
Date
1954
Other tags...

每个项目的数据以标签名称(标题、作者、日期等)开头,后跟一个值,每个标签或值都在连续的行中,大约一万行。 我希望列与标签一样多,行与包含标题、日期、作者等的项目一样多,如下所示:

Title | Author | Date | etc.
A Star is born | George Cukor | 1954 | etc.

有什么想法吗? 谢谢

【问题讨论】:

    标签: openrefine


    【解决方案1】:

    这是您的原始数据集:

    使用“转置 --> 将行中的单元格转置为列”(将选项 2 保留为默认值)。你会得到这个:

    然后,在第一列中,应用“Transpose --> Columnize by key/value columns”并且不要更改那里的默认选项。最终结果:

    这显然适用于更多标签/列,但前提是每个标签/列后跟一个值。

    【讨论】:

    • 感谢您的回答。问题是我有时在每个标签之后有多个值,例如超过 1 个作者,每个标签都在不同的行上。因此,在应用您的解决方案时,我改变了结果。
    • 这是您所描述的问题的解决方案,其中涉及标签“后跟 a 值”而不是“值”。当且仅当您拥有可能的标签的完整列表时,才有可能为您的实际问题找到解决方案。但这是另一个问题。 :)
    • 你是对的 :-) 我会问我自己的问题,这样你就会更好地理解我在寻找什么。
    • 请编辑您原来的问题,或者,在这种情况下,最好写一个新问题。答案就是答案,问题就是问题。 (顺便欢迎使用 StackOverflow)。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-06-28
    • 2018-09-14
    相关资源
    最近更新 更多