【发布时间】:2019-03-22 16:57:17
【问题描述】:
最近我在使用 R 时遇到了类似的问题,现在我想在 python 2.7 中使用 pandas 来解决这个问题。我已经在这里查看了几个类似的问题,但是仍然有问题。
我有两个数据框:
import pandas as pd
dfa = pd.DataFrame([["1", "1", "2", "A"], ["2", "1", "2", "A"], ["3", "3",
"4", "B"], ["4", "3", "4", "B"], ["5", "5", "6", "C"], ["6", "5", "6",
"C"], ["7", "7", "8", "D"], ["8", "7", "8", "D"]], columns=['TimeStamp',
'Min', 'Max', 'Group'])
dfb = pd.DataFrame([['1'], ['2'], ['3'], ['4'], ['5'], ['6'], ['7'], ['8']],
columns = ['TimeStamp'])
我正在寻找一种方法,根据时间戳在 dfb 中创建组 id,该时间戳在 dfa 中每个组的 min-max 范围内。所以,dfb_final:
这适用于更大的数据集,我已经简化了示例。我只是不确定下一步该做什么。根据其他答案,我得到了 dfa 中的 min max 列。非常感谢向大家学习。
【问题讨论】:
标签: python python-2.7 pandas dataframe