【发布时间】:2012-11-18 09:22:55
【问题描述】:
我有一个非常大的推文数据库。大多数推文都有多个#hashtags 和@mentions。我希望所有#hashtags 在一列中用空格分隔,而所有@mentions 在另一列中。我已经知道如何提取#hashtag 和@mention 的第一次出现。但我不知道要全部拿到吗?一些推文有多达 8 个#hashtags。手动浏览推文并复制/粘贴#hashtags 和@mentions 对于超过 5,000 条推文来说似乎是一项不可能完成的任务。
这是我想要的一个例子。我有 A 列,我想要一个可以填充 B 列和 C 列的宏。(我在 Windows 和 Excel 2010 上)
Column A
-----------
Dear #DavidStern, @spurs put a quality team on the floor and should have beat the @heat. Leave #Pop alone. #Spurs a classy organization.
Live broadcast from @Nacho_xtreme: "Papelucho Radio"http://mixlr.com nachoxtreme-radio … #mixlr #pop #dance
"Since You Left" by @EmilNow now playing on KGUP 106.5FM. Listen now on http://www.kgup1065.com #Pop #Rock
Family Night #battleofthegenerations Dad has the #Monkeys Mom has #DonnieOsman @michaelbuble for me #Dubstep for the boys#Pop for sissy
@McKinzeepowell @m0ore21 I love that the PNW and the Midwest are on the same page!! #Pop
我希望 B 列看起来像这样:
Column B
--------
#DavidStern #Pop #Spurs
#mixlr #pop #dance
#Pop #Rock
#battleofthegenerations #Monkeys #DonnieOsman #Dubstep #Pop
#pop
C 列看起来像这样:
Column C:
----------
@spurs @heat
@Nacho_xtreme
@EmilNow
@michaelbuble
@McKinzeepowell @m0ore21
【问题讨论】:
-
你付多少钱 :) ?说真的,如果您能描述您尝试过的内容和您的编程技能水平,这将有所帮助:创建宏、使用 VBA、使用 Excel 对象模型和正则表达式。来自常见问题解答:您的问题应该有合理的范围。如果你能想象一整本书都能回答你的问题,那你就问得太多了。。另请参阅here。