【问题标题】:How to create features columns based on values across diff columns如何根据不同列的值创建特征列
【发布时间】:2021-12-26 02:09:01
【问题描述】:

您好,我正在尝试在 Orange 中进行一种热编码,以便进行购物篮分析。

目前我的 CSV 中有如下交易数据:

C# Items
C1 Apple Orange
C2 Baby Milk Apple Orange

我想知道我可以采取哪些步骤来处理橙色或其他软件中的数据,以便我能够为我的数据获取此状态

C# Apple Orange Baby Milk
C1 1 1 0
C2 1 1 1

目前,当我尝试使用“连续离散变量 - 每行一个特征”对橙色数据进行预处理时,我得到了单独的特征值列。

【问题讨论】:

    标签: csv data-mining orange


    【解决方案1】:

    这并不完全简单,但您可以使用逗号或分号连接您的产品,将其传递给语料库,使用正则表达式根据您的连接字符(逗号、分号)应用标记化,然后使用文本添加的词袋-在。我已经使用 Associate 插件进行了尝试,它似乎可以工作。

    【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-02-14
    • 1970-01-01
    • 2020-09-20
    • 1970-01-01
    相关资源
    最近更新 更多