【问题标题】:How do I split a text columns rows base on a delimiter or phrase and keep the name on each split?如何根据分隔符或短语拆分文本列行并在每次拆分时保留名称?
【发布时间】:2019-04-23 00:33:02
【问题描述】:

我有一个包含两列的电影评论数据框:电影名称和评论。我想根据分隔符将评论拆分成句子 .,?!或短语。然后,我想进行拆分评论并将其向下移动一列,同时将电影的名称向下移动一列。重点是让基于每个句子或短语的情感分析更容易。

df[review] = df['review'].str.split('. or ? or ! or ?').reshape(0,1)

movie1.........Great movie...................................................................................................
movie1.........and Alot of action............................................ movie2.........What did I think?..........................................................................................
movie2..........It was a horrible...........................................................................................
movie2..........and waste of money!!..............................

【问题讨论】:

  • 拜托,您能否更具体地举例说明输入(您拥有的数据)和输出(您想要的数据)是什么?
  • @GabrielPellegrino 它是一个数据框,其中包含电影名称列和对电影的评论。想想 MovieLens 数据集。评论可以是一部电影的多行评论。我想将评论分成多个句子,每个句子在自己的行中,第一列是电影名称,另一列是评论。

标签: python dataframe split reshape


【解决方案1】:

df.Review.str.split('.').apply(Series, 1).stack()

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-12-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多