【发布时间】:2016-04-12 14:42:11
【问题描述】:
[在此处输入图像描述][1]我正在努力弄清楚回归是否是我需要走的路线,以解决我目前使用 Python 面临的挑战。这是我的场景:
- 我有一个 195 行 x 25 列的 Pandas 数据框
- 所有数据(索引和标题除外)都是整数
- 我希望将一个特定列(B 列)与所有其他列进行比较
- 尝试确定任何列中是否存在影响或影响 B 列的数字范围
- 我想在 Python 中计算的结果示例类似于:当 D 列中的数据介于 10.20 - 16.4 之间时,B 列高于 3.5
我在线阅读的 Python 回归示例似乎生成了我不需要的图表和统计数据(或者我可能解释不正确)。我认为描述我所问内容的正确措辞是识别 Pandas 数据框中两列之间线性的特定值或值范围。
谁能帮我指出正确的方向?
提前谢谢大家!
【问题讨论】:
-
那么你想要实现的是,当D列中的数据在10.20 - 16.4之间时,确定B列是否在3.5以上?你能提供一些示例数据框吗?
-
我想了解哪些数字或范围会影响 B 列的结果。我很快就会发布一个示例数据框。
-
抱歉,我无法添加附件。数据框的复制/粘贴未正确显示。
标签: python pandas machine-learning statistics regression