【发布时间】:2018-09-26 06:26:26
【问题描述】:
我有如下数据集
Cust_ID 子部门日期 Bill_Value 1513 洗涤剂条 20180204 30 1513 薯条 20180803 160 1513 果汁 20180204 30 1513 集装箱 20180803 79 1513 糖果和棒棒糖 20180803 165 1513 奶酪 20180204 203.04 1513 清洁剂和雨刷 20180803 159 1513 巧克力 20180803 448 1513 冷冻蔬菜零食 20180803 570 1860 咸饼干 20180110 40 1860 燕麦 20180705 60 1860 糕点 20180815 198 1860 奶酪 20180110 85 1860 素汤粉 20180814 20 1860 芝士 20180123 99 1860 北印度混合 20180502 59 1860风味牛奶20180502 40我想根据客户 ID 对数据进行随机抽样,以便选择所选客户的所有交易
【问题讨论】:
-
我试图在 R 中做,预期的输出是当我做随机样本时,它应该选择客户完成的所有交易。如果不应该错过所选 Cust_ID 的任何交易
-
你能发布预期的输出吗?举个例子会更清楚。
-
Cust_ID SubDepartment Date Bill_Value 1513 Detergent Bars 20180204 30 1513 French Fries 20180803 160 1513 Fruit Based Juices 20180204 30 1513 Containers 20180803 79 1513 Candies & Lollypops 20180803 165 1513 Cheese 20180204 203.04 1513 Cleaners & Wipers 20180803 159 1513 Chocolates 20180803 448 1513 冷冻蔬菜零食 20180803 570。随机抽样不应留下客户在不同日期/产品上完成的任何交易
-
请在您的问题中添加“一种可能的”结果。