【发布时间】:2019-09-04 18:58:13
【问题描述】:
简单地说,我想检测患者是否患有肺癌或不使用胸部 X 射线图像。
我在这里遇到的问题是: 我有来自 3 个不同来源的 3 个数据集,其中 3 个主题都是胸部 X 射线图像,假设所有其他医学属性也相同。 第一个数据集包含 130 张正常和癌症诊断患者的图像。 第二个数据集包含 40 张正常患者的图像 第三个数据集包含 120 张癌症患者的图像。
因此,我想结合来自 3 个不同来源的 3 个数据集来训练和评估我的模型。 我打算混合和打乱所有数据,然后开始分成训练、验证、测试集。可以吗?
还有什么我应该注意的东西/特征吗?
【问题讨论】:
标签: deep-learning dataset distribution