Python Pandas 回归答案

【问题标题】：Python Pandas RegressionPython Pandas 回归
【发布时间】：2016-04-12 14:42:11
【问题描述】：

[在此处输入图像描述][1]我正在努力弄清楚回归是否是我需要走的路线，以解决我目前使用 Python 面临的挑战。这是我的场景：

我在线阅读的 Python 回归示例似乎生成了我不需要的图表和统计数据（或者我可能解释不正确）。我认为描述我所问内容的正确措辞是识别 Pandas 数据框中两列之间线性的特定值或值范围。

谁能帮我指出正确的方向？

提前谢谢大家！

【问题讨论】：

【解决方案1】：

此时，您的目标听起来很像探索性数据分析。您可能应该首先使用pandas.Series.corr（实际上与二元回归相同）计算您的目标column B 和任何其他column 之间的correlation，您可以使用list：

other_cols = [col for col in df1.columns if col !='B']
corr_B = [{other: df.loc[:, 'B'].corr(df.loc[:, other])} for other in other_col]

要掌握特定范围，我建议您查看：

为了可视化双变量和简单的多变量关系，我建议

seaborn 包，因为它包含各种类型的图，旨在帮助您快速掌握变量之间的协变。例如，请参阅单变量和双变量分布示例here、线性关系图here 和分类数据图here。

以上内容应该可以帮助您理解双变量关系。一旦你想发展到多变量关系，你可以返回到scikit-learn 或statsmodels 最适合python 恕我直言的包。希望这有助于您入门。

【讨论】：