【发布时间】:2020-12-22 06:57:11
【问题描述】:
以下是包含银行客户交易数据的示例表。我需要创建一个单独的列作为客户的年薪,从txn_description 列获取数据。
Customer_ID txn_description Amount Type
01 POS 345 Dr
02 SALARY 2000 Cr
03 INTER BANK 148 Dr
04 SALARY 1500 Cr
05 NEFT 289 Dr
06 SALARY 1800 Cr
01 NEFT 40 Dr
02 SALARY 2000 Cr
04 POS 69 Dr
04 SALARY 1500 Cr
06 SALARY 1800 Cr
注意:交易数据为三个月。因此,工资在此表中三次记入特定客户的帐户,为期三个月。
(Dr = 借方交易,Cr = 贷方交易)
【问题讨论】:
-
从三个月的数据来看
taking annual salary of customer背后的逻辑是什么?这个Since the transaction data is of three months the customer ID will not be unique.是什么意思? -
一位客户将一些金额作为工资记入他的帐户。我们需要根据这些数据计算他的年薪......
-
太棒了。当我们有 3 个月而不是 1 个月的工资数据时怎么样...检查编辑...
-
在这种情况下,您必须按月份和客户进行过滤。即,整个过滤后的数据框在三个月中只有一个条目。我的建议是,这样做,
df.sort(["Customer_ID", "Date"])和df.drop_duplicates(subset=["Customer_ID", "Date"], keep='first')。这将具有上述条件。 -
排序后我应该继续 df[df["txn_description"]=="SALARY"] df["Annual"] = df["Amount"]*12
标签: python pandas data-science data-analysis