【问题标题】:Mining Twitter Data to find insights about a user?挖掘 Twitter 数据以找到有关用户的见解?
【发布时间】:2012-04-09 07:41:23
【问题描述】:
我从一个项目开始,该项目将通过他的 Twitter 个人资料分析用户的兴趣和参与度。通过分析他的推特数据可以获得什么样的指标?我觉得可以做的事情包括:
- 通过分析他的推文,用户谈论最多的话题(他的兴趣)。
- 他活跃的社区(通过分析标签)
- 通过将推文分类为正面/负面来了解人的情绪。
其他趋势可能包括他的外展活动和他通常与之互动的人。
还有其他有趣的方面可以通过一个人的个人资料得出吗? Twitalyzer 似乎也显示了与此人互动最多的年龄段,但我不知道如何做到这一点。
我还计划将该项目开发为 web 应用程序。我打算使用 PHP 来制作爬虫。对于挖矿部分,您会建议坚持使用 PHP 还是推荐其他其他技术/语言?
我一直在寻找灵感的一些项目包括:
【问题讨论】:
标签:
twitter
nlp
data-mining
text-mining
【解决方案1】:
分析某个人的品牌忠诚度,尤其是当这个人有影响力的时候,这可能是非常有见地的。
【解决方案2】:
您还可以考虑他所在的社区。
通过提取他提到的(或他提到的)并生成图表,您可以深入了解用户和他感兴趣的人。特别是如果您在工作中引入中心性概念......
【解决方案3】:
如果对用户的洞察是重中之重,我会将范围扩大到 Twitter 之外。
例如,您可以假设 twitter 标签是他们在其他服务上使用的用户名,甚至可能用于常见的电子邮件地址分发者(gmail、yahoo)。如果他们的简历中有其他帐户名称,您可以调查他们以查看他们是否在对用户信息限制较少的平台上拥有帐户。
如果主要关注点是专门使用用户的 Twitter 提要,我想我会将此作为扩展的想法。