【发布时间】:2015-12-13 09:07:09
【问题描述】:
感谢您的帮助。我有一个熊猫数据框。我想使用正则表达式搜索数据框的 3 列,然后返回所有符合搜索条件的行,按我的列之一排序。我想把它写成一个函数,所以如果可能的话,我可以用其他标准来实现这个逻辑,但我不太确定如何做到这一点。
例如,我知道如何提取搜索结果(col1 是列名):
idx1 = df.col1.str.contains(r'vhigh|high', flags=re.IGNORECASE, regex=True, na=False)
print df[~idx1]
但我不知道如何采取这种类型的操作,并使用多列执行它然后排序。有人有什么建议吗?
【问题讨论】:
-
如何执行上面显示的操作但遍历每一列。然后将结果索引存储为集合;最后,您可以找到最终所需行的集合的交集。