【发布时间】:2021-01-01 08:12:05
【问题描述】:
谁能解释一下这两种不同类型的火车测试拆分。我知道第一个。我在某人的代码上看到的第二个。
train_text, temp_text, train_labels, temp_labels = train_test_split(df['text'], df['spam'],
random_state=42,
test_size=0.3,
stratify=df['spam'])
df_train, df_valid = model_selection.train_test_split(
text, test_size=0.1,
random_state=42, stratify=data.spam.values)
在第二个例子中,为什么这个人只取了 2 个变量而不是 4 个
【问题讨论】:
标签: python pandas machine-learning scikit-learn train-test-split