【问题标题】:Find multiple words using df['var'].str.extract() (Python)?使用 df['var'].str.extract() (Python) 查找多个单词?
【发布时间】:2016-08-05 01:35:54
【问题描述】:

我正在尝试使用 str.extract() 提取数据框中一行中的任何单词,但我最终只得到一个单词。例如在我的数据框的一列中:

var1
THIS IS A STRING

当我使用时:

df['words'] = df['var1'].str.extract('([A-Z]\w{0,})')

输出是

var1                words
THIS IS A STRING    THIS

如何提取整个短语“这是一个字符串”?

谢谢!

【问题讨论】:

  • 您的数据框引用了var1,但您的摘录自df['test']。错字?
  • 是的,这是错字。感谢您指出。

标签: python string pandas dataframe extract


【解决方案1】:

IIUC 你可以使用split 任意空格\s+ 然后apply Series

print df
               var1
0  THIS IS A STRING

print df.var1.str.split('\s+').apply(pd.Series)
      0   1  2       3
0  THIS  IS  A  STRING

【讨论】:

    猜你喜欢
    • 2020-12-09
    • 2013-09-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-03
    • 1970-01-01
    • 2015-06-16
    • 2021-12-17
    相关资源
    最近更新 更多