【问题标题】:How to create "Category" column based on "description column"如何根据“描述列”创建“类别”列
【发布时间】:2019-01-27 21:10:47
【问题描述】:

我正在处理具有“描述”列的银行交易数据集,其中包含描述交易的单个短语。我想将数据集中的类似交易归为类别。

例如,如果交易 1 的描述 =“Roger - B111”和交易 2 的描述 =“互联网账单 293290”,那么我想将它们的描述都更改为“电信”。

我正在寻找的最终结果是一个名为“交易类别”的新列,该列将具有不同的类别级别(食品、电信、账单)。

你有什么好的方法来做这件事吗?

【问题讨论】:

  • 首先,这是python、pandas还是SQL?请不要说“所有这些”,请提出一个具体问题,并说明您使用的是什么语言/软件。 SQL 也有很多方言。
  • 我在 Big Query 中有数据集,所以我可以使用 SQL 查询它。我还在数据的一个子集上使用 Python,看看我是否可以在 python 中解决它

标签: python sql dataframe


【解决方案1】:

你可以使用case,但你必须弄清楚逻辑:

select t.*,
       (case when description in ('Roger - B111', 'Internet bill 293290')
             then 'Telecommunication'
             . . .
        end) as category
from t;

【讨论】:

  • 谢谢。通常,同一类型的交易有许多变体,例如:“Internet Bill T232”和“Internet Bill 1111”。你认为在一个单词上使用 like 运算符是个好主意吗?
  • @AdamObaid 。 . .如果这是您的逻辑要求,请使用like
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-02-13
  • 1970-01-01
  • 2020-04-24
  • 2021-05-19
  • 1970-01-01
  • 2021-07-13
相关资源
最近更新 更多