【发布时间】:2018-11-19 23:36:09
【问题描述】:
我有一个 pandas 数据框,其中有两列填充了 pandas 集。我想检查一列中的所有值是否是另一列的子集。我认为下面的代码可以工作,但似乎你不能将 .issubset() 应用于两个系列。
例如:
data = [[['one','orange','green'],['one','orange']],[['milk','honey'],['Clarke', 'honey']]]
df = pd.DataFrame(data, columns=['Column_1','Column_2'])
Are_all_column_2_values_valid = df.loc[:, 'Column_2'].apply(set).issubset(df.loc[:, 'Column_1'])
desired_output = pd.series([True,False])
这两个集合中的所有值都是字符串。
任何帮助将不胜感激!
【问题讨论】:
标签: python python-3.x pandas dataframe set