【发布时间】:2021-10-27 13:30:00
【问题描述】:
我有一个数据框,其中包含 text 和 user 列。
| user | text |
|---|---|
| Tom | I love bananas |
| Dick | I love apples |
| Harry | I love apples and bananas |
我想查找包含fruits 列表的text 行。为了
每个匹配的字符串都会在新列fruits 和fruits_with_colors 中添加一个新行。预期输出如下:
| user | text | fruits |
|---|---|---|
| Tom | I love bananas | bananas |
| Dick | I love apples | apples |
| Harry | I love apples and bananas | apples |
| Harry | I love apples and bananas | bananas |
我在考虑如何执行此操作时遇到了一些麻烦。我正在使用熊猫做以下事情:
fruits = ['apples', 'bananas']
df_with_matches = df[df['text'].str.contains('|'.join(fruits))]
但我返回错误sequence item 0: expected str instance, list found
【问题讨论】:
-
第二张表是预期的输出吗?
-
谢谢,我已经编辑了问题以反映这一点。