【发布时间】:2020-10-09 00:41:44
【问题描述】:
假设我有一个 n-gram 列表,并且只有当它们已经包含在列表中的二元组或三元组中时,我才想删除任何一元组。
例如:
ngram_list = ["apple cider", "apple", "cat man", "cat", "batman", "bat"]
我想结束的是:
ngram_list = ["apple cider", "cat man", "batman", "bat"]
在结果中,“apple”被删除,因为它包含在二元组“apple cider”中,而“cat”被删除,因为它包含在二元组“cat man”中,但“bat”仍然存在,因为即使“bat”是在“蝙蝠侠”中,“蝙蝠侠”不是二元组或三元组。
我想解决这个问题的方法是只留出一元组,遍历它们,然后在一个单独的列表中搜索每个一元组,其中只包含二元组和三元组……但我只是想知道什么是最有效的方法是什么?
【问题讨论】:
标签: python-3.x list n-gram