【发布时间】:2019-01-27 21:10:47
【问题描述】:
我正在处理具有“描述”列的银行交易数据集,其中包含描述交易的单个短语。我想将数据集中的类似交易归为类别。
例如,如果交易 1 的描述 =“Roger - B111”和交易 2 的描述 =“互联网账单 293290”,那么我想将它们的描述都更改为“电信”。
我正在寻找的最终结果是一个名为“交易类别”的新列,该列将具有不同的类别级别(食品、电信、账单)。
你有什么好的方法来做这件事吗?
【问题讨论】:
-
首先,这是python、pandas还是SQL?请不要说“所有这些”,请提出一个具体问题,并说明您使用的是什么语言/软件。 SQL 也有很多方言。
-
我在 Big Query 中有数据集,所以我可以使用 SQL 查询它。我还在数据的一个子集上使用 Python,看看我是否可以在 python 中解决它