【发布时间】:2018-10-11 21:21:21
【问题描述】:
我有一个来自论文的数据集,我很难验证他们报告的决定系数 R 平方。我使用了 sklearn 和 scipy 库,我得到了不同的答案。为什么?哪个更可靠? p.s.当我使用 Excel 作为另一种选择时,我得到了与 scipy 相同的答案。
下面是我用来比较 SKlearn 和 Scipy 的结果的代码:
import pandas as pd
from scipy import stats
from sklearn.metrics import r2_score
data = pd.read_csv("output.csv", header=None)
y_measured = data.iloc[0, :].values
y_predicted = data.iloc[1, :].values
print(r2_score(y_measured, y_predicted)) # prints 0.708717556205
slope, intercept, r_value, p_value, std_err = stats.linregress(y_measured, y_predicted)
print(r_value**2) # prints 0.731889173485
【问题讨论】:
标签: python scipy scikit-learn statistics