【发布时间】:2018-04-24 23:08:35
【问题描述】:
vsample_data = credit_card.sample(n=520, replace='False')
print(vsample_data)
在这里,我试图从数据集中抽取 520 个数据点,但无法获得正确的样本数据,因此从信用卡欺诈数据集中具有两个类的概率相等,即 Class-0(非欺诈)和第 1 类(欺诈)。
【问题讨论】:
-
这里credit_card是信用卡欺诈检测数据集
-
为什么不将其拆分为两个数据集,一个用于欺诈,一个用于非欺诈,每个样本 260 个?
-
我在想一个不分裂的办法
-
你能告诉我如何对数据进行采样,以便我可以获得 520 个包含 class-0 和 class-1 的数据点
-
随机选择0类260分,1类260分。