【发布时间】:2021-06-30 10:21:46
【问题描述】:
我正在使用 Yake(Yet Another Keyword Extractor)从数据框中提取关键字。 我只想提取二元组和三元组,但 Yake 只允许设置最大 ngram 大小而不是最小大小。您将如何删除它们?
例子df.head(0):
文字: '哎呀,是的,我喃喃自语,语言转换现在处于不确定状态。'
关键词: '[('oui', 0.04491197687864554), ('语言转换',0.09700399286574239), ('喃喃自语', 0.15831692877998726)]'
我想从关键字列中删除 oui、mumbled 及其分数。
感谢您的宝贵时间!
【问题讨论】:
标签: python dataframe keyword n-gram