【发布时间】:2019-04-23 00:33:02
【问题描述】:
我有一个包含两列的电影评论数据框:电影名称和评论。我想根据分隔符将评论拆分成句子 .,?!或短语。然后,我想进行拆分评论并将其向下移动一列,同时将电影的名称向下移动一列。重点是让基于每个句子或短语的情感分析更容易。
df[review] = df['review'].str.split('. or ? or ! or ?').reshape(0,1)
movie1.........Great movie...................................................................................................
movie1.........and Alot of action............................................ movie2.........What did I think?..........................................................................................
movie2..........It was a horrible...........................................................................................
movie2..........and waste of money!!..............................
【问题讨论】:
-
拜托,您能否更具体地举例说明输入(您拥有的数据)和输出(您想要的数据)是什么?
-
@GabrielPellegrino 它是一个数据框,其中包含电影名称列和对电影的评论。想想 MovieLens 数据集。评论可以是一部电影的多行评论。我想将评论分成多个句子,每个句子在自己的行中,第一列是电影名称,另一列是评论。
标签: python dataframe split reshape